Reference No.: Al 

Filing Date: October 7, 2003 

Application No.: 10/680,824 



(12) NACH DEM VERTRAG UBER DIE INTERNATIONALE ZUSAMMENARBEIT AUF DEM GEBIET DES 
PATENTWESENS (PCT) VER6FFENTLICHTE INTERNATIONALE ANMELDUNG 



(19) Weltorganisation fur geistiges Eigentum 
Internationales Bttro 




i mil iDiint ii minmii mi i n uiiieiiiiiii niiiininim mi iiuin imiiii mi 



(43) Internationales VerOffentlichungsdatum (10) Internationale Verdffentlichungsnummer 

3.Juli 2003 (03.07.2003) PC t WO 03/054189 A2 



(51) Internationale Patentklassifikation 7 : C12N 15/00 

(21) Internationales Aktenzeicben: PCT/EP02/ 14302 

(22) Internationales Anmeldedatum: 

16. Dezember 2002 (16.12.2002) 

(25) Einreichungssprache: Deutsch 

(26) Verttffentlichungssprache: Deutsch 

(30) Angaben zur PrtoritSt: 

101 63 161.8 20. Dezember2001 (20.12.2001) DE 

(71) Anmelder (fur alle Bestimmungsstaaten miiAusnahme yon 
US): SUNGENE GMBH & CO. KGAA [DE/DE]; Cor- 
rensstrasse 3, 06466 Gatersleben (DE). 

(72) Erfinder; und 

(75) Erfinder/Anmelder (nur fur US): BIESGEN, Christian 

[DE/DE]; Reichenstr. 29, 06484 Quedlinburg (DE). 

(74) Anwalt: BIEBERBACH, Andreas; BASF Aktienge- 
sellschaft, 67056 Ludwigshafen (DE). 



(81) Bestimmungsstaaten (national): AE, AG, AL, AM, AT, 
AU, AZ, BA, BB, BG, BR, BY, BZ, CA, CH, CN, CO, CR, 
CU, CZ, DE, DK, DM, DZ, EC, EE, ES, FI, GB, GD, GE, 
GH, GM, HR, HU, ID, IL, IN, IS, JP, KE, KG, KP, KR, 
KZ, LC, LK, LR, LS, LT, LU, LV, MA, MD, MG, MK, 
MN, MW, MX, MZ, NO, NZ, OM, PH, PL, PT, RO, RU, 
SC, SD, SE, SG, SK, SL, TJ, TM, TN, TR, TT, TZ, UA, 
UG, US, UZ, VC, VN, YU, ZA, ZM, ZW. 

(84) Bestimmungsstaaten (regional): ARIPO-Patent (GH, 
GM, KE, LS, MW, MZ, SD, SL, SZ, TZ, UG, ZM, ZW), 
eurasisches Patent (AM, AZ, BY, KG, KZ, MD, RU, TJ, 
TM), europalsches Patent (AT, BE, BG, CH, CY, CZ, DE, 
DK, EE, ES, FI, FR, GB, GR, IE, IT, LU, MC, NL, PT, 
SE, SI, SK, TR), OAPI-Patent (BF, BJ, CF, CG, CI, CM, 
GA, GN, GQ, GW, ML, MR, NE, SN, TD, TG). 

Verdffentlicht: 

— ohm internationalen Recherchenbericht und erneut zu 
veroffentlichen nach Erhalt des Berichis 

Zur ErU&rung der Zweibuchstaben-Codes und der anderen 
Abkurzungen wird auf die Erkiarungen ("Guidance Notes on 
Codes and Abbreviations") am Anfang jeder regularen Ausgabe 
der PCT-Gazette verwiesen. 



< 

o\ 

00 (54) Title: METHODS FOR THE TRANSFORMATION OF VEGETAL PLASTIDS 
i-< 

if) (54) Bezeichnung: VERFAHREN ZUR TRANSFORMATION VON PFLANZLICHEN PLASTIDEN 

(57) Abstract: The invention relates to novel methods for the production of transgenic plants with genetically modified plastids, in 
O addition to transgenic plants produced according to said method. 

O 

^ (57) Zusammenfassung: Die vorliegende Erfindung betrifft neue Verfahren zur Herstellung transgener Pflanzen mit gentechnisch 
^ veranderten Plastiden sowie die mit diesen Verfahren hergestellten transgenen Pflanzen. 
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Verfahren zur Transformation von pflanzlichen Plastiden 
Beschreibung 

5 

Die vorliegende Erfindung betrifft neue Verfahren zur Herstellung 
transgener Pf lanzen mit gentechnisch ver&nderten Plastiden sowie 
die mit diesen Verfahren hergestellten transgenen Pf lanzen. 

10 Ziel biotechnologischer Arbeiten an Pflanzen ist die Herstellung 
von Pflanzen mit vorteilhaften, neuen Eigenschaf ten zum Beispiel 
zur Steigerung der landwirtschaftlichen ProduktivitSt, zur Quali- 
tatssteigerung bei Nahrungsmitteln oder zur Produktion bestiramter 
Chemikalien oder Pharmazeutika. 

15 

Plastiden stellen Organellen innerhalb pflanzlicher Zellen mit 
einem eigenen Genom dar. Sie haben eine wesentliche Funktion 
in der Photosynthese sowie der Aminosaure- und Lipidbiosynthese. 
Das Genom der Plastiden besteht aus einer doppelstrMngigen, 

20 zirkularen DNA mit einer durchschnittlichen Grdfce von 120 bis 
160 kb und liegt - zum Beispiel in Blattzellen - mit ca. 1900 
bis 50000 Kopien pro Zelle vor (Palmer (1985) Ann Rev Genet 
19:325-54). Ein einzelnes Plastid tragt dabei eine Kopienzahl von 
ca. 50 bis 100. Der Begriff der Plastiden umfasst Chloroplasten, 

25 Proplastiden, Etioplasten, Chromoplasten, Amyloplasten, Leuko- 
plasten und Elaioplasten (Heifetz P (2000) Biochimie 82:655-666). 
Die verschiedenen Formen sind in einander tiberftihrbar und ent- 
stehen alle aus den Proplastiden. Daher enthalten alle Aus- 
prSgungs formen der Plastiden die gleiche Erbinformation. Bevor- 

30 zugt werden in der Literatur jedoch grune Zellen, die Chloro- 
plasten als AusprSgungsform enthalten, als Ausgangsmaterial fur 
die Transformation von Plastiden genutzt. 

Es ist fur die Pf lanzenbiotechnologie von grofcem wirtschaf tlichen 
35 Interesse, effiziente Methoden fiir die Plastidentransf ormation 
zu entwickeln (McFadden G (2001) Plant Physiol. 125:50-53). Die 
stabile Transformation von Plastiden hoherer Pflanzen geh5rt 
dabei zu den grofien Herausforderungen. 

40 Die bei der Insertion in die nukleSre DNA oft angewandte 

Technik der ungezielten (illegitimen) DNA-Insertion haben bei 
der Plastidentrans formation den Nachteil, dass mit sehr hoher 
Wahrscheinlichkeit auf dem gendichten plastid&ren Genom ein 
essentielles Gen getroffen wird, was haufig letal fiir die Pflanze 

45 ware. In Plastiden ist daher eine gezielte Insertion von Fremd- 
DNA vorteilhaft. 
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Verschiedene Verfahren zur gezielten Insertion in das plastidSre 
Genom sind beschrieben. Zuerst wurde die Plastidentransf ormation 
in Grunalgen beschrieben (Boynton JE et al. (1988) Science 240: 
1534-1538; Blowers AD et al. (1989) Plant Cell 1:123-132), spater 
5 in hSheren Pflanzen wie Tabak (Svab 2 et al. (1990) Proc Natl 
Acad Sci USA 87:8526-8530). 

EP-A 0 251 654, US 5,932,479, US 5,451,513, US 5,877,402, 

WO 01/64024, WO 00/20611, WO 01/42441, WO 99/10513, WO 97/32977, 

10 WO 00/28014, WO 00/39313 beschreiben Methoden und DNA-Konstrukte 
zur Transformation von Plastiden httherer Pflanzen, wobei die 
zu transformierende DNA uber homologe Rekombination ("Doppel- 
Crossover") in das Plastom (Plastidengenom) eingebaut wird. Im 
allgemeinen werden auf jeder Seite der zu insert ierenden Seguenz 

15 homologe Regionen von 1000 bp oder mehr genutzt. Dies ftihrt sehr 
schnell zu gro&en Vektoren, deren Handhabung wenig komfortabel 
ist. DarCiber hinaus sinkt die Effizienz der Transformation. 
Mit zunehmender LSnge der zu integr ierenden Fremd-DNA sinkt die 
Effizienz der homologen Rekombination. Ein weiterer Nachteil 

20 ist die Tatsache, dass fttr jede Pflanzenart ein homologer Bereich 
identif iziert werden muss, der ftir den Prozess der DNA Inte- 
gration mittels Doppel-Crossover genutzt werden kann. WO 99/10513 
beansprucht, eine intergenische DNA Sequenz identif iziert zu 
haben, die ausreichend horaolog zwischen den Genomen der Chloro- 

25 plasten vieler hoherer Pflanzen sei und so als universelle 
Zielsequenz fungieren kann. Dass dieser Vektor bei anderen 
Arten als Tabak erfolgreich genutzt werden kann, wurde indies 
nicht nachgewiesen . Im Gegenteil: In WO 01/64024 passt derselbe 
Erfinder den Transformationsvektor an Nicht -Tabak Pf lanzenarten 

30 an, indem er aus diesen isolierte homologe DNA-Seguenzen ver- 
wendet. Da bei alien der oben beschriebenen Verfahren nur wenige 
Rekombinationsereignisse resultieren, ist eine Selektion der 
rekombinanten plastidSren DNA-Molektile erforderlich. 

35 Die Plastiden-DNA hdherer Pflanzen liegt in bis zu mehreren 
tausend Kopien pro Zelle vor. Um eine stabile Integration der 
Fremd-DNA zu erreichen, miissen alle Kopien der Plastiden-DNA 
gleichermaSen verSndert werden. Im Fall der Plastidentrans- 
f ormation spricht man davon, den homotransplastomen Zustand 

40 erreicht zu haben. Diesen Zustand erreicht man durch einen 
sogenannten "segregation and sorting" Prozess, indem man die 
Pflanzen unter stSndigen Selektionsdruck h&lt. Durch den an- 
haltenden Selektionsdruck werden wahrend der Zell- und Plastiden- 
teilung solche Plastiden angereichert, in denen bereits viele 

45 Kopien der plastidaren DNA verSndert wurden. Der Selektions- 
druck wird aufrecht gehalten, bis der homotransplastome Zu- 
stand erreicht ist (Guda C et al. (2000) Plant Cell Reports 
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19:257-262). Es ist eine grofie Herausf ordering, alle Kopien 
des Plastidengenoms zu ver£ndern, urn homotransplastome Pflanzen 
zu erhalten, die auch ttber Generationen ohne Zugabe eines 
Selektionsmittels das Fremdgen stabil in ihr plastidares Genom 
5 eingebaut haben (Bogorad L (2000) TIBTECH 18:257-263). Zus&tz- 
lich zu dem standigen Selektionsdruck wird gegebenenfalls durch 
wiederholte Regeneration bereits trans formier ten Gewebes das 
Erreichen des homotransplastomen Zustand sichergestellt (Svab Z 
und Maliga P (1993) Proc Natl Acad Sci USA 90:913-917). Dies 

10 jedoch schrclnkt das Pf lanzenmaterial, welches fiir die Plastiden- 
trans formation zur Verfttgung steht, ein. Es wird daher vor- 
geschlagen, das Transgen ggf . mit einem anderen Gen, welches 
essentiell fiir das Uberleben der Pflanze ist, zu koppeln. 
Gewebekultur-Techniken und Selektionsprozesse sind meist nicht 

15 universell auf alle Pf lanzenarten anwendbar und stellen eine 
wesentliche Limitierung der Plastidentransformation dar, 
die insbesondere die Ubertragbarkeit der Methode auf andere 
Arten als Tabak betrifft (Kota Met al. (1999) Proc Natl Acad 
Sci USA 96:1840- 1845). Eine kurzlich ver6f fentlichte Trans- 

20 formation von Plastiden von Tomate basiert auf Modif ikationen 
im Regenerations- und Selektionsschema (Ruf S et al. (2001) 
Nature Biotech 19:870-875), die jedoch kosten- und zeit- 
intensiv sind. Ein anderer Ansatz zielt darauf ab, die Anzahl 
der Plastiden pro Zelle und der DNA Molekale pro Plastid zu 

25 reduzieren, urn so weniger DNA Molekiile modifizieren zu mussen 
(Bogorad L (2000) TIBTECH 18:257-263). Insgesamt sind die 
Selektions- und Segregationsprozesse sehr zeitaufwendig. 

WO 99/10513 beschreibt ein Verfahren bei dem auf dem zu trans- 
30 formierenden Plasmid ein plastidarer ORI (origin of replication, 
Replikationsursprung) lokalisiert wird, um so die Anzahl der fiir 
die Integration in das Plastidengenom zur Verfugung stehenden 
Kopien des zu trans formierenden Vektors zu erhehen (Guda C et al. 
(2000) Plant Cell Reports 19:257-262). 

35 

Die Notwendigkeit die Technik der Plastidentransformation zu ver- 
bessern wird auch bei Heifetz und Tuttle erwahnt (Heifetz P und 
Tuttle AM (2001) Curr Opin Plant Biol 4:157-161). WO 00/32799 
lehrt, die Effizienz der Plastidentransformation durch den Ein- 

40 satz von Pflanzen mit vergrSSerten Plastiden zu erhShen. Dadurch 
ergibt sich eine grofce Oberflache der Plastiden, durch die die 
zu transformierende DNA leichter in die Plastiden eindringen 
kann. Der Mechanismus der DNA Integration erfolgt aber auch hier 
mitt els konventioneller homologer Rekombination wie bei den oben 

45 beschriebenen Verfahren. 
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Verschiedene weitere Verfahren zur sequenzspezif ischen Inte- 
gration von DNA - insbesondere in die nukleSre DNA - sind 
beschrieben. Beschrieben ist ein Verfahren basierend auf selbst- 
spleiGenden Introns der Gruppe II. SelbstspeiSende Introns der 
5 Gruppe II k6nnen sequenzspezif isch - beispielsweise in intronlose 
Gene - insertieren. Die sequenzspezif ische Hydrolyse der Ziel-DNA 
wird von einem RNA- Protein (Ribonukleoprotein) Komplex kataly- 
siert. Die Sequenzspezifit&t der Endonuklease-Funktion wird dabei 
vor allem durch Ausbilden von Basenpaarungen zwischen dem RNA- 

10 Anteil des Ribonukleoprotein-Komplexes und der Ziel-DNA bestimmt. 
Die Verwendung von Introns der Gruppe II als Vektoren ftir Fremd- 
DNA wurde diskutiert. Durch Modifikation bestiinmter Sequenzen 
eines Gruppe II Introns konnte dessen Ziel-Spezif itat ver&ndert 
werden. Auch konnten weitere Sequenzen in Gruppe II Introns 

15 insertiert werden, ohne deren Funktionen zu zerstoren (Yang J 
et al. (1996) Nature 381:332-335; Eickbush TH (1999) Curr Biol 
9:R11-R14; Matsuura M et al. (1997) Genes Develop 11:2910-2924; 
Cousineau B et al. (1998) Cell 94: 451-462). Die Anpassung an 
bestimmte Zielsequenzen und die Ermittlung der damit verbundenen 

20 Regeln ist jedoch aufwendig und wurde bislang im Detail nur fttr 
das Ll.ltrB Intron entschlttsselt (Mohr G et al. (2000) Genes 
Develop 14:559-573). Zudem war die Effizienz des Retrohomings 
durch die Modifikation signifikant reduziert und nicht jedes der 
getesteten modifizierten Introns insertierte in die gewtinschte 

25 Ziel-DNA. Nachteil der Technik ist, dass einige Positionen in 
der Nukleotid-Sequenz festgelegt sind, was die Auswahl der Ziel- 
Region in der zu trans formierenden DNA einschrankt (Guo H et al. 
(1997) EMBO J 16:6835-6848). AuSerdem scheint die Effizienz des 
Retrohoming-Prozesses gegenuber dem der Wi Id typ- Introns ver- 

30 mindert. Die Effizienz der Introninsertion an verschiedenen 

Stellen an den betrachteten Genen war verschieden hoch. Ziel der 
Arbeiten war die Bereitstellung einer verbesserten Methode zur 
gezielten Insertion von DNA in die nukleare DNA von Organismen, 
die keine effiziente homologe Rekombination erlauben (Guo et al. 

35 (2000) Science 289:452-456). Die beschriebenen Versuche sind 
extrachromosomal sowohl in dem Prokaryonten E.coli als auch in 
humanen Zellen realisiert worden. Die Ubertragbarkeit auf die 
chromosomale DNA hoherer Organismen oder die Anwendbarkeit auf 
plastidSre DNA wurde weder beschrieben noch gezeigt. Es wurde 

40 lediglich vorgeschlagen, zu versuchen, dieses System derart 
zu optimieren, dass eine Insertion in chromosomale DNA hOherer 
Eukaryoten erfolgen kann. Dieses System soil eine alternative 
Methode in hoheren Eukaryoten darstellen, die keine effiziente 
homologe Rekombination zeigen (Guo et al. (2000) Science 

45 289:452-456). Dies gilt nicht far Plastiden hbherer Pflanzen, 
bei denen die homologe Rekombination - zumindest bei einzelnen 
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plastidaren DNA-MolekUlen - in der Regel unproblematisch 
realisiert werden kann. 

Neben Tabak wurde die Plastidentransformation in Kartof fel 
5 (Sidorov VA et al. (1999) Plant J 19:209-216; WO 00/28014), 
Petunie (WO 00/28014) , Reis (Khan MS und Maliga P (1999) Nature 
Biotech 17:910-915; WO 00/07431; US 6,153,813), Arabidopsis 
(Sikdar SR et al. (1998) Plant Cell Reports 18: 20-24; 
WO 97/32977) und Raps (WO 00/39313) gezeigt (Ubersichtsartikel: 
10 Bogorad L (2000) TIBTECH 18:257-263). Ktirzlich wurden auch 
transplastome Tomatenpf lanzen beschrieben (Ruf S et al. (2001) 
Nature Biotech 19:870-875). 

Die Erzeugung sequenzspezif ischer Doppelstrangbrtiche mit Hilfe 
15 von Restriktionsenzymen in eukaryontischen Genomen u.a. Pf lanzen 
ist beschrieben (Puchta H (1999) Methods Mol Biol 113:447-451). 

WO 96/14408 beschreibt die Homing-Restriktionsendonuklease I-Scel 
sowie verschiedene M6glichkeiten deren Verwendung. Eine Anwendung 
20 zur Insertion von DNA-Sequenzen in plastid&re DNA ist nicht 
beschrieben. 

Posfai et al. beschreiben ein Verfahren zum Austausch von Genen 
in dem Prokaryoten E.coli (Posfai G et al. (1999) Nucleic Acids 

25 Res 27 (22) :4409-4415) . Dabei kommt es im E.coli Genom zu einer 
intramolekularen Rekombination zwischen dem endogenen und dem 
mutierten Gen, die durch einen Schnitt mit dem Restriktionsenzym 
I-Scel induziert wird, Rekombinationen in E.coli verlaufen deut- 
lich effizienter und nach vermutlich anderen Mechanismen als im 

30 Kern hoherer Eukaryonten (zum Beispiel beschrieben bei Kuzminov A 
(1999) Microbiol Mol Biol Rev. 63 (4) :751-813) . 

"Homing" meint das Phanomen, dass in einem Kompartiment zwei oder 
mehr Kopien einer DNA-Sequenz existieren, wobei wenigstens eine 

35 dieser beiden Sequenzen durch eine weitere DNA-Sequenz unter- 
brochen ist, und in Folge eine Kopie der unterbrechenden DNA- 
Sequenz auch in die nicht unterbrochene DNA-Sequenz eingebracht 
wird. Meist tritt das PhSnomen als Intron-Homing auf . Hier 
existieren zwei oder mehr Allele eines Gens in einem Komparti- 

40 ment, wobei wenigstens eines dieser Allele kein Intron besitzt. 
In Folge wird eine Kopie des Introns auch in das intronlose Allel 
eingebracht. 

Introns in plastid&ren Genen hSherer Pflanzen sind beschrieben 
45 (Vogel J et al . (1999) Nucl Acids Res 27:3866-3874; Jenkins BD 
et al. (1997) Plant Cell 9:283-296; Xu MQ et al. (1990) Science 
250: 1566-1570). Das Spleifcing eines arteigenen, nicht modi- 
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fizierten Introns mit den naturlichen Exonbereichen an einem 
ektopischen Lokus im Plastidengenom ist ebenfalls beschrieben 
(Bock R und Maliga P (1995) Nucl Acids Res 23 (13) :2544-2547) . 
Es gibt bisher keine Versuche, artfremde Introns, die darxiber 
5 hinaus derart modifiziert sind, dass sie zusatzliche genetische 
Information besitzen und/oder in einer nicht natttrlichen Sequenz- 
umgebung spleifcen, in Plastiden hGherer Pflanzen einzubringen . 

Versuche von Eddy und Gold zum "Homing'-Prozess in E.coli 
10 zeigten, das bestimmte Rekorabinationssysteme erf order lich sind. 
Die Art des Rekombinationssystems des Wirtes ist eine Schlussel- 
variable (Eddy SR und Gold L (1992) Proc Natl Acad Sci USA 
89:1544-1547). Es konnte daher nicht davon ausgegangen werden, 
dass der natiirlich vorkommende Prozess des "Homings" beliebig 
15 von einem in einen anderen Organismus (ibertragen werden kann, 
zumal wenn dieser Prozess in diesem Organismus natttrlicherweise 
mutmafclich nicht vorkommt. 

Durrenberger et al. beschreiben die Induktion einer intrachroroo- 
20 somalen Rekombination in Chloroplasten der einzelligen Griinalge 
Chlamydomonas reinhardtii unter Verwendung der I-Crel Homing- 
Endonuklease (Diirrenberger F et al. (1996) Nucleic Acid Res 
24 (17) :3323-3331) . Die Rekombination erfolgt zwischen dem endo- 
genen 23S-Gen und einer ins Chromosom eines I-Crel Deletions- 
25 stammes insert ierten 23S-cDNA, die eine I-Crel Schnitts telle 
enthait. DoppelstrangbrUche werden durch "Mating* des ent- 
sprechenden transgenen Organismus mit einem I-Crel nattirlicher- 
weise exprimierenden Organismus induziert. Zum Zeitpunkt des 
Doppelstrangbruches ist die Fremd-DNA bereits in die chromosomale 
30 DNA insertiert und die Rekombination erfolgt intramolekular und 
nicht zwischen zwei separaten Molekulen. 

Kiirzlich wurde gezeigt, dass ein in Chlamydononas reinhardtii 
natiirlich vorkommendes , mobiles Intron, welches auch eine Homing 

35 Endonuklease kodiert, effizient in eine intronlose Kopie trans- 
formiert werden kann (Odom OW et al- (2001) Mol Cell Biol 21: 
3472-3481) . Die Steigerung der Tranf ormationsrate war dabei 
von der Anwesenheit der Homing-Endonuklease abhangig. In der 
Diskussion wird allgemein und ohne konkrete Ausfiihrungshinweise 

40 vorgeschlagen, die Plastidentransf ormation dadurch zu verbessern, 
dass Doppelstrangbriiche induziert werden. Dazu sollen zunSLchst 
die Erkennungsregionen selten schneidender Nukleasen in einem 
ersten Schritt eingebracht werden, und das nachfolgende Inte- 
grationsereignis dann an dem selben Locus stattfinden. Genauere 

45 Hinweise, wie die Erkennungsregionen einzubringen sind, welche 
Nukleasen und Erkennungsregionen verwendet werden konnen, wie der 
erste und der zweite Schritt konkret gestaltet werden etc. werden 
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nicht gegeben. Bisher wurde lediglich gezeigt, dass in Plastiden 
der Alge Chlamydomonas das Einbringen eines arteigenen Introns 
mittels der naturlicherweise mit der Mobilitcit des Intron ver- 
bundenen Homing Endonuklease funktionierte. Zudein wurden die 
5 Ergebnisse in einer Algenart generiert. Die oben erwahnten Ver- 
suche von Eddy und Gold mit E. coli, bei denen wie in Plastiden 
hoherer Pflanzen keine mobilen Introns der Gruppe I bekannt sind, 
zeigen, dass eine Ubertragbarkeit auf heterologe Systeme nicht 
ohne weiteres mdglich ist. Die Ubertragbarkeit der Beobachtungen 
10 von der Alge Chlamydomonas auf hShere Pflanzen ist fur den Fach- 
mann daher keinesfalls naheliegend. Im Gegenteil gibt es zahl- 
reiche Hinweise, die die Ubertragbarkeit eher in Frage stellen: 

1. Homing-Systeme sind nicht einfach von einem auf das andere 
15 System iibertragbar (Eddy SR und Gold L (1992) Proc Natl 

Acad Sci USA 89:1544-1547). Die Ubertragbarkeit auf h6here 
Pflanzen ist urn so mehr fraglich, da in den bereits sequen- 
zierten Plastidengenomen h6herer Pflanzen (http: //mega- 
sun, bch.umontreal . ca/ogmp/pro jects/other/cp_list . html ) 
20 keine Homing Endonukleasen indentifiziert wurden. Es ist 

daher davon auszugegehen, dass die im Plastidengenom hoherer 
Pflanzen gefundenen Introns nicht mobil sind und dort natur- 
licherweise kein Homing-Mechanismus besteht. 

25 2. Chlamydomonas hat nur jeweils ein Plastid, wShrend in den 

Zellen hSherer Pflanzen bis zu 100 Plastiden pro Zelle vor- 
liegen. 

3. Die konventionelle Plastidentrans formation ist in Chlamydo- 
30 monas urn GrSfcenordnungen effizienter als in hoheren Pflanzen, 

was darauf hindeutet, dass diese beiden Systeme nicht direkt 
miteinander vergleichbar sind. Hinsichtlich der Regeneration 
von transplastomen Algen bzw. transplastomen Pflanzen kdnnte 
auch eine entscheidende Rolle spielen, dass die Teilung der 
35 Plastiden der Algen mit dem Zellzyklus synchronisiert ist, 

wahrend dies nicht fur die Plastiden der hdheren Pflanzen 
gilt (Sato N (2001) Trends Plant Science 6:151-155). 

4. Die Mechanismen der DNA Integration in Plastiden von 

40 Chlamydomonas und hoheren Pflanzen scheinen grundlegend 

verschieden zu sein. So wurde gefunden, dass die zwischen- 
artliche Plastidentransformation (nutzen von homologen 
Bereichen anstelle von identischen Sequenzen) in Chlamydo- 
monas zu einer deutlichen Reduktion der Transformations* 

45 effizienz fiihrt, was in Tabak aber nicht beobachtet werden 

kann. Ahnliches gilt auch fOr den Abstand eines molekularen 
Markers auf der homologen DNA zur heterologen Sequenz auf dem 
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Transformationsplasraid: Je naher der molekulare Marker 
am Rand der Zielregion fur die Integration mittels Doppel- 
Crossover liegt, desto seltener wird er bei der Trans- 
formation in Plastiden von Chlamydomonas tibertragen. In 
5 Tabak wurden multiple Rekombinationsmechanismen beobachtet, 

wobei aber auch molekulare Marker nahe am Rand der homologen 
Bereiche ef fektiv bei der Transformation in das Plastiden- 
genom ubertragen wurden (Kavanagh TA et al. (1999) Genetics 
152: 1111-1122 und Referenzen darin) . 

10 

5. In Chlamydomonas verschmelzen die Plastiden der beiden Eltern 
wahrend einer Kreuzung, auch bei einer zwischenartlichen 
Kreuzung. Die Plastidenfusion ist bei Chlamydomonas ein 
natiirlicher Prozess und auch die DNA der Plastiden wird 

15 gemischt und neu rekombiniert • Daher machen mobile Introns 

in den Organellen dieser Organismen Sinn. Im Gegensatz 
dazu werden die Plastiden bei den meisten hdheren Pf lanzen 
uniparental vererbt, so dass es weder zu einem Mischen der 
plastidaren DNA kommt, noch Rekombinationen zwischen der 

20 plastidaren DNA der Mutter und des Vaters auftreten kSnnen. 

Selbst in den Pf lanzenarten, in denen es zu biparentaler Ver- 
erbung der Plastiden kommt, konnte keine Fusion der Plastiden 
beobachtet werden. Es liegt daher die Vermutung nahe, dass 
eine natiirliche Plastidenfusion in h5heren Pflanzen aus- 

25 geschlossen ist (Hagemann R (1992) Plastid genetics in 

higher plants; in Cell Organelles, Herausgeber: Herrmann RG, 
Springer Verlag, Wien, S. 65-96) und das Mechanismen wie das 
Intron-Homing nicht entwickelt sind oder sogar unterdriickt 
werden . 

30 

Die Erhdhung der Effizienz der homologen Rekombination innerhalb 
der Kern-DNA mit Hilfe von selten schneidenden Endonukleasen 
wurde bei verschiedenen Organismen beschrieben (Puchta H et al. 
(1993) Nucleic Acids Research. 21(22) :5G34-40; Puchta Het al. 

35 (1996) Proc Natl Acad Sci USA 93:5055-5060; Rong YS und Golic KG 
(2000) Science 28:2013-2018; Jasin M (1996) Trends Genet 12: 
224-229) . Ira Unterschied zu Plastiden ist die Insertion mittels 
homologer Rekombination in die Kern-DNA problematisch und erfolgt 
meist mittels zufailiger illegitimen Integration. Dies zeigt, 

40 dass im Kern-Genom etablierte Techniken nicht unbedingt auf 
die Plastiden Ubertragen werden konnen. Bei Plastiden hdherer 
Pflanzen findet im Gegensatz zu der Situation im Kern nahezu aus- 
schliefclich und mit hoher Effizienz eine Integration tiber homo- 
loge Rekombination statt (Bock R und Hagemann R (2000) Progress 

45 in Botany 61:76-90; Maliga P et al. (1994) Homologous recombi- 
nation and integration of foreign DNA in plastids of higher 
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plants. In Homologous recombination and gene silencing in plants. 
Paszkowski J, ed. (Kluwer Academic publishers), S. 83-93). 

Die Effizienz der homologen Rekombination zur DNA-Integration 
5 in das Plastom wurde allgemein nicht als limitierender Faktor 
angesehen und - im Gegenteil - als unkritisch eingestuft. Die 
aktuelle Forschung zur Optimierung der Plastidentransformation 
richtet sich demzufolge nicht auf eine Optimierung der homologen 
Rekombination, sondern zum Beispiel auf verbesserte Selektions- 
10 marker, verbesserte Selektions- und Regenerationstechniken etc. 
Nichtsdestotrotz sind bislang keine wesentlichen Durchbriiche 
erzielt worden. 

Wie die oben beschriebenen Verfahren und Probleme bei der 
15 Plastidentransformation deutlich hervorheben, ist die Bereit- 
stellung neuer Verfahren zur Herstellung homotransplastomer 
Pflanzen ein lange bestehendes ungel5stes Bedtirfnis der Pflanzen- 
biotechnologie. Ein weiteres Bedttrfnis ist die Vermeidung von 
Antibiotika- Oder Herbizidselektionsmarkern aus Griinden der 
20 Zulassung und Verbraucherakzeptanz . Fttr die Plastidentrans- 
formation ist bisher noch kein Verfahren beschrieben, dass ohne 
einen solchen Selektionsmarker auskommt. 

Es ergab sich daher die Aufgabe, neue Verfahren zu entwickeln, 
25 die eine ef fiziente Integration von Fremd-DNA in alle Kopien der 
Plastiden-DNA sicher stellt und eine ef fiziente Selektion ent- 
sprechender homotransplastomer Pflanzen ermoglicht. Diese Aufgabe 
wurde durch Bereitstellung des erf indungsgemSSen Integrations-/ 
Selektionsverfahrens in liberraschender Weise gelSst. 

30 

Ein erster Gegenstand der Erfindung betrif ft ein Verfahren 
zur Integration einer DNA-Sequenz in die plastidare DNA einer 
mehrzelligen Pflanze oder von dieser abgeleiteten Zelle und zur 
Selektion uberwiegend homotransplastomer Zellen oder Pflanzen, 
35 dadurch gekennzeichnet , dass 

a) die plastidSren DNA-Molekiile besagter mehrzelliger 
Pflanze oder von dieser abgeleiteten Zelle mindestens 
eine Erkennungssequenz zur gezielten Induktion von DNA- 

40 Doppelstrangbrtichen enthalten und 

b) mindestens ein Enzym geeignet zur Induktion von DNA- 
Doppelstrangbrttchen an der Erkennungssequenz zur gezielten 
Induktion von DNA-Doppelstrangbrtichen sowie mindestens ein 

45 Transf ormationskonstrukt urafassend eine Insertionssequenz 

in mindestens einem Plastid besagter mehrzelligen Pflanze 
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oder von dieser abgeleiteten Zelle zusammengebracht werden, 
und 

c) die Induktion von DNA-Doppelstrangbriichen an den Erkennungs- 
5 sequenzen zur gezielten Induktion von DNA-Doppelstrangbrttchen 

erfolgt, und 

d) die Insertionssequenz in die plastidare DNA insertiert, 
wobei die Funktionalitat der Erkennungssequenz zur gezielten 

10 Induktion von DNA-Doppelstrangbrtichen deaktiviert wird, 

so dass besagte Erkennungssequenz nicht mehr durch das 
Enzym geeignet zur Induktion von DNA-Doppelstrangbrtichen 
geschnitten werden kann, und 

15 e) Pflanzen oder Zellen isoliert werden, bei denen die Inser- 
tionssequenz in die plastidaren DNA-Molekttle insertiert 
wurde. 

Das System ermSglicht ttberraschenderweise eine erhebliche 
20 Steigerung der Ef fizienz bei der Herstellung ttberwiegend 

homotransplastomer Pflanzen. Dabei wird sowohl die Ef fizienz 
der Insertion in die plastidSre DNA als auch die Effizienz 
des Selektionsprozess tlberwiegend homotransplastomer Pflanzen 
gesteigert. 

25 

Durch die Anwendung des erf indungsgem&Sen Verf ahrens ergibt 
sich ein Selektionsdruck, die Insertionssequenz in alle Kopien 
der plastidaren DNA einzubauen. Im Idealfall erfolgt die Ver- 
breitung der Insertionssequenz unabh&igig von Selektionsmarkern 

30 wie Herbizid- oder Antibiotikaresistenzen. Dies hat deutliche 
Vorteile bezttglich Zulassung- und/ oder Verbraucherakzeptanz , Die 
Verwendung solcher Selektionsmarker kann jedoch die Effizienz 
weiter steigern. Das erfindungsgemafie Verfahren zur Herstellung 
homoplastomer Pflanzen ist den im Stand der Technik beschriebenen 

35 deutlich tlberlegen, da es einen schnelleren, ef f izienteren und 
damit kostengiinstigeren Weg zu homotransplastomen Pflanzen 
bietet. Ferner hat das System den Vorteil, dass die zur Trans- 
formation genutzten Konstrukte klein gehalten werden kdnnen, da 
im Vergleich zur Integration mittels des Doppel-Crossovers die 

40 homologen Bereiche im Plastidentransformations-Vektor kleiner 
sein bzw. g&nzlich fehlen kennen. 



45 
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Gegeniiber der Transformation des Zellkerns hat die Transformation 
von Plastiden zahlreiche Vorteile. Unter anderem sind zu nennen: 

a) Wahrend die homologe Rekombination in die nukleare DNA nur 
5 schwer zu realisieren ist, kann in Plastiden DNA leicht an 

einem vordefinierten Ort mitt els Doppel-Crossover, einer Form 
der homologer Rekombination, integriert werden. Positions - 
effekte oder "Genesilencing" , die man bei Kerntrans- 
formationen aufgrund der illegitimen Integration an einen 
10 nicht vordefinierten Lokus findet, werden so vermieden. 



b) Es konnen sehr hohe Expressionslevel erreicht werden, ver- 
mutlich aufgrund der hohen Kopiezahl der plastidaren DNA. 

15 c) Die DNA der Plastiden wird bei hSheren Pflanzen in der 

Regel nur maternal vererbt, so dass die eingebrachte Fremd- 
DNA nicht tiber Pollen verbreitet und ein Auskreuzen somit 
effektiv unterbunden werden kann. 



20 d) Die prokaryotische Natur der Plastiden erm6glicht die 
Expression von Genen im Rahmen einer polycistronischen 
Operonstruktur . Daher ist es nicht notwendig, jedes zu 
exprimierende Gen mit einem eigenen Promotor etc. aus- 
zurusten. Dies erleichtert das Einbringen vieler Gene 

25 auf einmal, etwa um ganze Biosynthesewege in die Plastiden 

einzubringen. 



n Plastid" meint die Proplastiden sowie alle daraus hervorgehenden 
Organellen wie beispielsweise Chloroplasten, Etioplasten, Chromo- 
30 plasten, Amyloplasten, Leukoplasten, Dermaplasten und Elaiopla- 
sten (Heifetz P (2000) Biochimie 82:655-666). 

n Plastom" meint das Genom, also die Gesamtheit der genetischen 
Information, eines Plastids. 

35 

*Homotransplastom" meint einen transplastomen und homoplastomen 
Zustand. 

"Transplastom" meint in Bezug auf beispielsweise eine Pflanze, 
40 Zelle, Gewebe, Plastid oder plastidare-DNA alle solche durch gen- 
technische Methoden zustemde gekommene Formen der vorgenannten, 
die eine plastidare DNA umfassen, die durch gentechnische 
Methoden modifiziert wurde, wobei die Modifikation beispiel- 
haft Subs ti tut ionen, Additionen, Deletionen, Inversion oder 
45 Insertionen eines oder mehrerer Nukleotidreste umfassen kann. 
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"Heteroplastom" meint das Vorliegen einer gemischten Population 
verschiedener plastidarer DNAs innerhalb eines einzelnen 
Plastides oder innerhalb einer Population von Plastiden inner- 
halb einer pflanzlichen Zelle oder Gewebe. 

5 

^Homoplastam'' meint eine einheitliche Population von plastidarer 
DNA innerhalb eines einzelnen Plastides oder innerhalb einer 
Population von Plastiden innerhalb einer pflanzlichen Zelle oder 
Gewebe. Homoplastome Zellen, Gewebe oder Pflanzen sind genetisch 
10 stabil, da sie nur eine Art plastidarer DNA umfassen d.h. sie 
bleiben im allgemeinen homoplastom auch wenn der Selektionsdruck 
nicht mehr anhalt. Durch Selbstung erhaltene Nachkommen sind 
ebenfalls homoplastom. 

15 Im Rahmen dieser Erf indung meint *iiberwiegend homoplastom" oder 
*iiberwiegend homotransplastom" all solche Pflanzen oder Zellen, 
bei denen der Anteil der erwiinschten plastidaren hinsichtlich 
eines Merkmals veranderten DNA-Molektile - beispielsweise mit der 
Erkennungssequenz zur gezielten Induktion von DNA-Doppelstrang- 

20 briichen oder der insertierten Insertionssequenz - mindestens 
50 %, bevorzugt mindestens 70 %, ganz besonders bevorzugt 
mindestens 90 %, am meisten bevorzugt mindestens 95 % von der 
Gesamtheit aller plastidaren DNA-Molektile in einer Pflanze oder 
einem Gewebe, Zelle bzw. Plastid derselben betragt. Uberwiegend 

25 homoplastome oder tiberwiegend homotransplastome Pflanzen kdnnen 
durch weiteres Auf rechterhalten des Selektionsdruckes und 
gegebenenfalls wiederholenden Regenerationen in homoplastome 
oder homotransplastome Pflanzen umgewandelt werden. Aufgrund des 
w Homing"-Prozesses ist jedoch ein andauernder Selektionsdruck 

30 nicht zwingend erforderlich. In einer besonderen Ausfiihrungsform 
ist daher eine Uberwiegend homoplastome bzw. homotransplastome 
Pflanze rein homoplastom bzw. homotransplastom. Eine Pflanze, die 
beztiglich einer DSB-Erkennungssequenz uberwiegend homoplastom 
bzw. homotransplastom oder rein homoplastom bzw. homotransplastom 

35 ist, wird infolge als n Masterpf lanze" bezeichnet. Der Anteil der 
erwiinschten plastidaren hinsichtlich eines Merkmals veranderten 
DNA-Molekiile kann beispielsweise mittels Southern Analyse - wie 
beispielhaft in Beispiel 4 beschrieben - in der dem Fachmann be- 
kannten Weise ermittelt werden. Das Verhaitnis zwischen den pla- 

40 stidaren Ausgangs-DNA Molekiilen und den hinsichtlich eines Merk- 
mals veranderten plastidaren DNA-Molekttlen lSsst sich durch Ver- 
gleich der Intensitat der jeweiligen Banden bestimmen. 

"Mehrzellige Pflanze oder von dieser abgeleiteten Zelle" meint 
45 allgemein jede Zellen, Gewebe, Teile oder Vennehrungsgut (wie 
Samen oder Friichte) einer Pflanze, die in ihrem adulten Zustand 
einen mehrzelligen Organismus darstellt oder darstellen kann. 
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Eingeschlossen sind im Rahmen der Erfindung alle Gattungen und 
Arten hSherer und niedrigerer Pflanzen des Pf lanzenreiches. Ein- 
jahrige, mehr jcihrige, monocotyledone und dicotyledone Pflanzen 
sind bevorzugt. Eingeschlossen sind reife Pflanzen, Saatgut, 
5 Sprosse und Keimlinge, sowie davon abgeleitete Teile, Vermeh- 
rungsgut (zum Beispiel Knollen, Samen oder Fruchte) und Kulturen, 
zum Beispiel Zell- oder Kalluskulturen. Reife Pflanzen meint 
Pflanzen zu jedem beliebigen Entwicklungsstadium jenseits des 
Keimlings. Keimling meint eine junge, unreife Pflanze in einem 
10 frtihen Entwicklungsstadium. 

Bevorzugt sind Pflanzen nachf olgender Pf lanzenfamilien: Amarant- 
haceae, Asteraceae, Brassicaceae, Carophyllaceae, Chenopodiaceae, 
Compositae, Cruciferae, Cucurbitaceae, Labiatae, Leguminosae, 
15 Papilionoideae, Liliaceae, Linaceae, Malvaceae, Rosaceae, 

Rubiaceae, Saxifragaceae, Scrophulariaceaie, Solanacea, Stercu- 
liaceae, Tetragoniacea, Theaceae, Umbelliferae. 

Bevorzugte monokotyle Pflanzen sind insbesondere ausgewahlt aus 
20 den monokotylen Kulturpf lanzen, wie zum Beispiel der Familie der 
Gramineae wie Reis, Mais, Weizen oder andere Getreidearten wie 
Gerste, Hirse, Roggen, Triticale oder Hafer sowie dem Zuckerrohr 
sowie alle Arten von GrSsern. 

25 Bevorzugte dikotyle Pflanzen sind insbesondere ausgewShlt aus den 
dikotylen Kulturpf lanzen, wie zum Beispiel 

- Asteraceae wie Sonnenblume, Tagetes oder Calendula und andere 
mehr, 

30 

- Compos itae, besonders die Gattung Lactuca, ganz besonders die 
Art sativa (Salat) und andere mehr, 

- Cruci ferae, besonders die Gattung Brassica, ganz besonders 

35 die Arten napus (Raps), campestris (RObe) , oleracea cv Tastie 
(Kohl) , oleracea cv Snowball Y (Blumenkohl) und oleracea cv 
Emperor (Broccoli) und weitere Kohlarten; und der Gattung 
Arabidopsis, ganz besonders die Art thaliana sowie Kresse oder 
Canola und andere mehr, 

40 

- Cucurbitaceae wie Melone, Ktirbis oder Zucchini und andere mehr, 

- Leguminosae besonders die Gattung Glycine, ganz besonders die 
Art max (Sojabohne) Soja sowie Alfalfa, Erbse, Bohnengewachsen 

45 oder Erdnuss und andere mehr 
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- Rubiaceae, bevorzugt der Unterklasse Lamiidae wie beispiels- 
weise Coffea arabica oder Coffea liberica (Kaf festrauch) und 
andere mehr, 

5 - Solanaceae besonders die Gattung Lycopersicon, ganz besonders 
die Art esculentum (Tomate) und die Gattung Solanum, ganz be- 
sonders die Art tuberosum (Kartoffel) und melongena (Aubergine) 
sowie Tabak oder Paprika und andere mehr, 

10 - Sterculiaceae, bevorzugt der Unterklasse Dilleniidae wie bei- 
spielsweise Theobroma cacao (Kakaostrauch) und andere mehr, 

- Theaceae, bevorzugt der Unterklasse Dilleniidae wie beispiels- 
weise Camellia sinensis oder Thea sinensis (Teestrauch) und 

15 andere mehr, 

- Umbelliferae, besonders die Gattung Daucus (ganz besonders 
die Art carota (Karrotte) ) und Apium (ganz besonders die Art 
graveolens dulce (Selarie)) und andere mehr; und die Gattung 

20 Capsicum, ganz besonders die Art annum (Pfeffer) und andere 
mehr, 

sowie Lein, Soja, Baumwolle, Hanf, Flachs, Gurke, Spinat, Mohre, 
Zuckerrube und den verschiedenen Baum-, Nuss- und Weinarten, 
25 insbesondere Banane und Kiwi. 

Umfasst sind ferner Schmuckpf lanzen, Nutz- oder ZierbSume, 
Blumen, Schnittblumen, Straucher oder Rasen. Beispielhaft aber 
nicht einschrSnkend seien zu nennen Angiospernien, Bryophyten 

30 wie zum Beispiel Hepaticae (Leberblvimchen) und Musci (Moose) ; 
Pteridophyten wie Parne, Schachtelhalm und Lycopoden; Gymno- 
spermen wie Koniferen, Cycaden, Ginkgo und Gnetalen, die Familien 
der Rosaceae wie Rose, Ericaceae wie Rhododendrons und Azaleen, 
Euphorbiaceae wie Weihnachtssterne und Kroton, Caryophyllaceae 

35 wie Nelken, Solanaceae wie Petunien, Gesneriaceae wie das 

Usambaraveilchen, Balsaminaceae wie das Springkraut, Orchidaceae 
wie Orchideen, Iridaceae wie Gladiolen, Iris, Freesie und Krokus, 
Compositae wie Ringelblume, Geraniaceae wie Geranien, Liliaceae 
wie der Drachenbaum, Moraceae wie Ficus, Araceae wie Philodendron 

40 und andere mehr. 

Am meisten bevorzugt sind Arabidopsis thaliana, Nicotiana 
tabacum, Tagetes und Brassica napus sowie alle Gattungen und 
Arten, die als Nahrungs- oder Futtermittel zum Einsatz koramen, 
45 wie die beschriebenen Getreidearten, oder sich zur Herstellung 
von ftlen eignen, wie (Jlsaaten, Nussarten, Soja, Sonnenblume, 
KUrbis und Erdnuss. 
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"Enzym geeignet zur Induktion von DNA-Doppelstrangbrtichen an der 
Erkennungsseguenz zur gezielten induktion von DNA-Doppelstrang- 
brttchen" (infolge U DSBI-Enzym" fur "double atrand-fereak inducing 
.enzyme " ) meint allgemein all solche Enzyme, die in der Lage sind, 
5 sequenzspezif isch Doppelstrangbruche in doppelstr&ngige DNA 
zu erzeugen. Beispielsweise aber nicht einschr&nkend sind zu 
nennen : 

1. Restriktionsendonukleasen, bevorzugt Typ II Restriktions- 
10 endonukleasen, besonders bevorzugt Homing-Endonukleasen wie 

weiter unten im Detail beschrieben. 

2. Kiinstliche Nukleasen wie weiter unten im Detail beschrieben, 
wie beispielsweise chimere Nukleasen, mutierte Restriktions- 

15 oder Homing-Endonukleasen oder RNA-Proteinpartikel abgeleitet 

von mobilen Introns der Gruppe II. 

Sowohl natftrliche als auch kttnstlich hergestellte DSBI-Enzyme 
sind geeignet. Bevorzugt sind all solche DSBI-Enzyme, deren 
20 Erkennungssequenz bekannt ist und die entweder in Form ihrer 

Proteine (beispielsweise durch Aufreinigung) gewonnen oder unter 
Verwendung ihrer Nukleins&uresequenz exprimiert werden kannen. 

Bevorzugt wird das DSBI-Enzym unter Kenntnis seiner spezifischen 
25 Erkennungssequenz so ausgewShlt, dass es zusStzlich zu der 

Ziel-Erkennungssequenz keine weitere funktionellen Erkennungs- 
regionen im Plastidengenom besitzt. Ganz besonders bevorzugt 
sind deshalb Homing-Endonukleasen (ttbersicht: Belfort M und 
Roberts RJ (1997) Nucleic Acids Res 25:3379-3388; Jasin M (1996) 
30 Trends Genet 12:224-228; Internet: http://rebase.neb.com/rebase/ 
rebase.homing.html; Roberts RJ and Macelis D (2001) Nucleic 
Acids Res 29: 268-269). Diese erfullen aufgrund ihrer langen 
Erkennungssequenzen diese Anforderung. Aufgrund der geringen 
Gr6£e des Plastoms ist es jedoch auch denkbar, dass DSBI-Enzyme 
35 mit ktirzeren Erkennungssequenzen (beispielsweise Restriktions- 
endonukleasen) mit Erfolg eingesetzt werden konnen. 

Neben der oben beschriebenen bevorzugten Ausfuhrungsf orm, bei 
der lediglich eine einzelne Erkennungssequenz fttr das DSBI-Enzym 

40 in der plastidcLren DNA vorhanden ist, sind FSlle denkbar, bei 
denen auch weitere, funktionell gleiche Erkennungssequenzen vor- 
teilhaft genutzt werden k6nnen. Dies ist insbesondere der Fall, 
wenn das Plastom duplizierte Gene (z.B. in Form von invertierten 
"Repeats") umfasst. Hier soil die Integration in alle Kopien 

45 erfolgen, so dass auch ein Schnitt in alien Kopien wttnschenswert 
ist. 
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Die fiir derartige Homing-Endonukleasen kodierenden Sequenzen 
k6nnen beispielsweise aus dem Chloroplastengenom von Chlamy- 
domonas isoliert werden (Tunnel Met al- (1993) J Mol Biol 232: 
446-467). Sie sind klein (18 bis 26 kD) , weisen in ihrem offenen 
5 Leseraster (ORF) eine "coding usage" auf , die direkt fur nukleare 
oder plastidare Expression hOheren Pflanzen (Monnat RJ Jr et al. 
(1999) Biochem Biophys Res Com 255:88-93) geeignet ist. 

Weitere Homing-Endonukleasen sind unter der oben angegebenen 

10 Internet-Adresse aufgeftthrt, zu nennen sind beispielsweise 
Homing-Endonukleasen wie F-Scel, F-Scell, F-Suvl, F-TevI, 
F-TevII, I-Anial, I-Anil, I-Ceul, I-CeuAIIP, I-Chul, I-Cmoel, 
I-Cpal, I-CpaII, I-Crel, I-CrepsbIP, I-CrepsbIIP, I-CrepsbIIIP, 
I-CrepsbIVP, I-CsmI, I-Cvul, I-CvuAIP, I-DdiII, I-Dirl, I-Dmol, 

15 I-HspNIP, I-Llal, I-Msol, I-Naal, I-NanI, I-NclIP, I-NgrIP, 
I-NitI, I-Njal, I-Nsp236lP, I-PakI, I-PboIP, I-PcuIP, I-PcuAI, 
I-PcuVI, I-PgrIP, I-PobIP, I-Porl, I-PorIIP, I~PpbIP, I-Ppol, 
I-SPBetaIP, I-Scal, I-Scel, I-SceII, I-SceIII , I-SceIV, I-SceV, 
I-SceVT, I-SceVII, I-SexIP, I-SneIP, I-SpomCP, I-SpomIP, 

20 I-SpomIIP, I-SquIP, I-Ssp6803I, I-SthPhiJP, I-SthPhiST3P, 
I-SthPhiS3bP, I-TdeIP, I-TevI, I-TevII, I-TevIII, I-UarAP, 
I-UarHGPAlP, I-UarHGPA13P, I-VinIP, I-ZbiIP, PI-MtuI, PI-MtuHIP, 
PI-MtuHIIP, Pl-Pful, Pl-PfuII, Pl-Pkol, Pl-PkoII, PI-PspI, 
PI-Rma43812IP, PI-SPBetalP, Pl-Scel, PI-Tful, PI-TfuII, PI-Thyl, 

25 PI-Tlil, PI-Tlill. 

Bevorzugt sind dabei die Homing-Endonukleasen, deren Gensequenzen 
bereits bekannt sind, wie beispielsweise F-Scel, I-Ceul, I-Chul, 
I-Dmol, I-Cpal, I-CpaII, I-Crel, I-CsmI, F-TevI, F-TevII, I~TevI, 
30 I-TevII, I-Anil, I-Cvul, I-Llal, I-NanI, I-Msol, I-NitI, I-Njal, 
I-PakI, I-Porl, I-Ppol, I-Scal, I-Sce I, I-Ssp6803I, Pl-Pkol, 
Pl-PkoII, PI-PspI, PI-Tful, PI-Tlil. 

Besonders bevorzugt werden Homing-Endonuklease genutzt, die 
35 so in der Natur, besonders bevorzugt natttrlicherweise in 

Organellen vorkommen . Am meisten bevorzugt stammen die Homing- 
Endonukleasen aus Organismen, die bei ahnlichen Tempera turen 
leben wie Pflanzen. Hier sind von besonderem Interesse die aus 
Hefe und Chlamydomonas Spezies identif izierten Homing Endo- 
40 nukleasen. Natttrlich ist es auch denkbar, Homing Endonukleasen, 
die aus extremophilen Organismen isoliert wurden, zu nutzen, 
solange diese in den Plastiden der zu transformierenden Pf lanze 
aktiv sind. 



45 
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Ganz besonders bevorzugt sind 

I-Ceul (Cote MJ und Turmel M (1995) Curr Genet 27:177-183.; 
Gauthier A et al, (1991) Curr Genet 19:43-47; Marshall (1991) 
5 Gene 104:241-245; GenBank Acc.-No.: Z17234 Nukleotide 5102 

bis 5758), 

I-Chul (Cote V et al.(1993) Gene 129:69-76; GenBank Acc.-No.: 
L06107, Nukleotide 419 bis 1075), 

10 

I-Cmoel (Drouin M et al. (2000) Nucl Acids Res 28: 
4566-4572) , 

I-Cpal aus Chlamydomonas pallidostigmatlca (GenBank Acc.-No.: 
15 L36830, Nukleotide 357 bis 815; Turmel Met al. (1995) 

Nucleic Acids Res 23:2519-2525; Turmel, M et al. (1995) 
Mol Biol Evol 12:533-545; siehe auch SEQ ID NO: 13 bzw. 14) 

I-CpaII (Turmel M et al. (1995) Mol Biol Evol 12:533-545; 
20 GenBank Acc.-No.: L39865, Nukleotide 719 bis 1423), 

I-Crel (Wang J et al. (1997) Nucleic Acids Res 25: 3767-3776; 
Diirrenberger, F und Rochaix JD (1991) EMBO J 10:3495-3501; 
GenBank Acc.-No.: X01977, Nukleotide 571 bis 1062), 

25 

I-CsmI (Ma DP et al. (1992) Plant Mol Biol 18:1001-1004) 

I-NanI (Elde M et al. (1999) Eur J Biochem. 259:281-288; 
GenBank Acc.-No.: X78280, Nukleotide 418 bis 1155), 

30 

I-NitI (GenBank Acc.-No.: X78277, Nukleotide 426 bis 1163), 
I-Njal (GenBank Acc.-No. : X78279, Nukleotide 416 bis 1153), 

35 - I-Ppol kodiert auf der extrachromosomaler DNA im Kern von 
Physarvm polycephalum (Muscarella DE und Vogt VM (1989) 
Cell 56:443-454; Lin J und Vogt VM (1998) Mol Cell Biol 
18:5809-5817; GenBank Acc.-No.: M38131, Nukleotide 86 bis 
577) . Dariiber hinaus kann auch die von einem alternativen 

40 Startkodon ausgehende l&igere Sequenz, kodierend fttr I-Ppol 

genutzt werden. Diese Sequenz umfafit in der Sequenz gemSfi 
GenBank Acc.-No M38131 die Nukleotide 20 bis 577. Bevorzugt 
wird die kurzere Sequenz genutzt; sie kann jedoch an jeder 
Stelle durch die entsprechend l^ngere ausgetauscht werden. 

45 Besonders bevorzugt wird im Rahmen dieser Erf indung eine 

kttnstliche Sequenz genutzt, die ftir die selben AminosSuren 
kodiert, wie die Sequenz der Nukleotide 86 bis 577 der Se- 



WO 03/054189 PCT7EP02/14302 

18 

quenz gemafi GenBank Acc.-No.: M38131 (siehe auch SEQ ID NO: 
5, 11, 12, 70 Oder 71), 

I-Pspl (GenBank Acc.-No.: U00707, Nukleotide 1839 bis 3449), 

5 

I-Scal (Monteilhet C et al. (2000) Nucleic Acids Res 28: 
1245-1251; GenBank Acc.-No.: X95974, Nukleotide 55 bis 465) 

I-Scel aus den Mitochondxien der BSckerhefe (WO 96/14408; 
10 US 5,962,327 dort Seq ID NO: 1), 

Endo Seel (Kawasaki et al. (1991) J Biol Chem 266:5342-5347, 
identisch zu F-Scel; GenBank Acc.-No.: M63839, Nukleotide 159 
bis 1589) , 

15 - I-SceII (Sarguiel B et al. (1990) Nucleic Acids Res 
18:5659-5665) , 

I-SceIII (Sarguiel B et al. (1991) Mol Gen Genet. 
255:340-341) , 

20 

I-Ssp6803l (GenBank Acc.-No. : D64003, Nukleotide 35372 bis 
35824) , 

I-TevI (Chu et al. (1990) Proc Natl Acad Sci USA 
25 87:3574-3578; Bell-Pedersen et al. (1990) Nucleic Acids 

Resl8:3763-3770; GenBank Acc . -No . : AF158101, Nukleotide 
144431 bis 143694) , 

I-TevII (Bell-Pedersen et al. (1990) Nucleic Acids Res 
30 18:3763-3770;GenBank Acc.-No. : AF158101, Nukleotide 45612 

bis 44836), 

I-TevIII (Eddy et al. (1991) Genes Dev. 5:1032-1041), 

35 Ganz besonders bevorzugt sind kommerziell erh&ltliche Homing- 
Endonukleasen wie I-Ceul, I-Scel, I-Ppol, PI-PspI oder Pl-Scel. 
Am meisten bevorzugt sind I-Scel und I-Ppol. WcLhrend das Gen 
codierend fur I-Ppol in der natttrlichen Form genutzt werden kann, 
besitzt das Gen kodierend far I-Scel eine Editierstelle. Da die 

40 entsprechende Editierung in den Plastiden hoherer Pflanzen im 
Unterschied zu den Mitochondrien der Hefe nicht durchgefuhrt 
wird, muss eine kttnstliche das I-Scel Protein codierende Sequenz 
zur heterologen Expression dieses Enzyms eingesetzt werden 
(US 5,866,361) . 

45 
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Neben den aufgefuhrten Homing-Endonukleasen gibt es weitere 
Intron-kodierte Enzyme, die an homologen Stellen der Genome ver- 
wandter Organismen zu finden sind. Diese Homing-Endonukleasen 
besitzen in der Regel eine Shnliche Sequenzspezif itSt und sind 
5 daher ebenso gut als DSBI Enzym ftir die Einftihrung eines DSB in 
das Plastom an der DSB-Erkennungssequenz geeignet. So erkennen 
neben I-Crel die entsprechende Sequenz auch Sob2593c, Clu2593c, 
Col2593c, Ciy2593c, Hla2593c, Cag2593c / I-Cvul, I-PakI, TTnu2593c, 
Msp2593c, I-Msol, Sdu2593c, Mvi2593m, Nol2593m oder Aca2593m. 

10 Neben I-Ceul erkennen entsprechende Sequenz auch I-Cecl, I-Cmol, 
I-Cell, I-CpaIII, I-Cmul, I-Clul, I-SobI oder I-Astl. Neben 
I-Cpal erkennen eine entsprechende Sequenz auch Cbrl931c, 
Cfrl931c, Cmel931c, Cgel931c, Pcrl931c, Mspl931c, Msol931c, 
Ptul931c, Cvul931m, Mspl931m, Msol931m, Noll931m, Acal931m oder 

15 Snel931b. DarOber hinaus gibt es Introns, die an der Position 
1951 der 23S rDNA insertiert sind (Nummerierung bezieht sich 
auf homologen Position in der 23S rDNA von E. coli). Auch diese 
Introns kodieren f\ir putative Homing-Endonukleasen, die als DSBI 
Enzyme zum spezifischen Schneiden der plastidaren DNA genutzt 

20 werden konnen. Zu diesen geh5ren beispielsweise Cbrl951c, 

Mspl951c, Msol951c, Cvul951m oder Acal951m (Lucas P et al. (2001) 
Nucl Acids Res 29:960-969). 

Am meisten bevorzugt sind die Homing-Endonukleasen gemafi den 
25 Proteinsequenzen be.schrieben durch SEQ ID NO: 5, 12 oder 14. 
Bei der Herstellung entsprechender Expressionskassetten werden 
demzufolge Nuleinsauresequenzen eingesetzt, die ftir ein Protein 
gema£ SEQ ID NO: 5, 12 bzw. 14 kodieren, insbesonders bevorzugt 
ist dabei die Verwendung der Nukleinsauresequenzen gemaS SEQ ID 
30 NO: 11 bzw. 13 oder einer Expressionskassette gemafi SEQ ID NO: 4. 

Die Enzyme kSnnen in der dem Fachmann gelSuf igen Art und Weise 
aus ihren Herkunf tsorganismen aufgereinigt und/oder die fiir sie 
kodierende NukleinsSuresequenz kloniert werden. Die Sequenzen 
35 verschiedener Enzyme sind in der GenBank hinterlegt (s.o.). 

Als kunstliche DSBI-Enzyme seien beispielhaft chim&re Nukleasen 
zu nennen, die sich aus einer unspezif ischen Nukleasedom&ne und 
einer sequenzspezif ischen DNA-BindungsdomSne (z.B. bestehend aus 

40 Zinkfingern) zusammensetzen (Smith J et al. (2000) Nucl Acids 
Res 28(17) :3361-3369; Bibikova M et al. (2001) Mol Cell Biol. 
21:289-297). So wurde beispielsweise die katalytische Dom&ne 
der Restriktionsendonuklease Fokl an Zinkf ingerbinde-Domanen 
fusioniert wodurch die Spezifitat der Endonuklease definiert 

45 wurde (Chandrasegaran S & Smith J (1999) Biol Chem 380:841-848; 
Kim YG & Chandrasegaran S (1994) Proc Natl Acad Sci USA 
91:883-887; Kim YG et al. (1996) Proc Natl Acad Sci USA 



WO 03/054189 



PCT/EP02/14302 



20 

93:1156-1160). Auch die katalytische Domane der Ho-Endonuklease 
aus Hefe konnte bereits mit der beschriebenen Technik eine 
vordefinierte Spezifitat verliehen werden, indem diese an die 
Zinkf ingerdomane von Transkriptionsfaktoren fusioniert wurde 
5 (Nahon E & Raveh D (1998) Nucl Acids Res 26:1233-1239). 

Wie erwahnt, eignen sich insbesondere Zinkf ingerproteine als 
DNA-Bindungsdomane im Rahmen von chimMren Nukleasen. Diese DNA- 
bindenden Zinkf ingerdomanen kSnnen an jede beliebige DNA-Sequenz 

10 angepasst werden. Entsprechende Verfahren zur Herstellung 
entsprechender Zinkf ingerdomanen sind beschrieben und dem 
Fachmann bekannt (Beerli RR et al. (2000) Proc Natl Acad Sci 
USA 97(4) :1495-1500; Beerli RR et al. (2000) J Biol Chem 
275(42) :32617-32627; Segal DJ and Barbas CF 3rd. (2000) Curr 

15 Opin Chem Biol 4(1) : 34-39; Kang JS and Kira JS (2000) J Biol Chem 
275(12) :8742-8748; Beerli RR et al . (1998) Proc Natl Acad Sci USA 
95(25) :14628-14633; Kim JS et al. (1997) Proc Natl Acad Sci USA 
94(8) :3616-3620; Klug A (1999) J Mol Biol 293 (2) : 215-218 ; Tsai SY 
et al. (1998) Adv Drug Deliv Rev 30(1-3) :23-31; Mapp AK et al. 

20 (2000) Proc Natl Acad Sci USA 97 (8) :3930-3935; Sharrocks AD 

et al. (1997) Int J Biochem Cell Biol 29 (12) : 1371-1387; Zhang L 
et al. (2000) J Biol Chem 275 (43) : 33850-33860) . Verfahren zur 
Herstellung und Selektion von Zink-Finger DNA-Bindedoraanen 
mit hoher Sequenzspezif itat sind beschrieben (WO 96/06166, 

25 WO 98/53059, WO 98/53057). Durch Fusion einer so erhaltenen DNA- 
Bindedomane an die katalytische Domane einer Endonuklease (wie 
beispielsweise der Fokl oder Ho-Endonuklease) kann man chimare 
Nukleasen mit jeder beliebigen Spezifitat herstellen, die als 
DSBI-Enzyme im Rahmen der vorliegenden Erfindung vorteilhaft 

30 eingesetzt werden k6nnen. 

Kunstliche DSBI-Enzyme mit veranderter Sequenzspezif itat kdnnen 
auch durch Mutagenese bereits bekannter Restriktionsendonukleasen 
oder Homing Endonukleasen durch dem Fachmann gelaufige Methoden 

35 erzeugt werden. Insbesondere von Interesse ist neben der Muta- 
genese von Homing-Endonukleasen mit dem Ziel, eine veranderte 
Substratspezifitat zu erzielen, auch die Mutagenese von Matu- 
rasen. Maturasen haben haufig viele Gemeinsamkeiten mit Homing- 
Endonukleasen und lassen sich durch wenige Mutationen ggf . in 

40 Nukleasen umwandeln. Dies wurde beispielsweise far die Maturase 
im bi2 Intron der Backerhefe gezeigt. Lediglich zwei Mutationen 
in dem die Maturase kodierenden offenen Leseraster (ORF) reichten 
aus, diesem Enzym eine Homing-Endonuklease Aktivitat zu verleihen 
(Szczepanek & Lazowska (1996) EMBO J 15:3758-3767). 
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Weitere kxinstliche Nukleasen kSnnen mit Hilfe mobiler Gruppe II 
Introns und den von ihnen kodierten Proteinen oder Teile dieser 
Proteine erzeugt werden. Viele mobile Gruppe II Introns bilden 
mit den von ihnen kodierten Proteinen RNA-Protein-Partikel , die 
5 sequenzspezifisch DNA erkennen und schneiden konnen. Die Seguenz- 
spezifitat kann dabei durch Mutagenese von bestiimtiten Bereichen 
des Introns (siehe unten) den Bedtirfnissen angepasst werden 
(WO 97/10362) . 

10 Dera Fachmann sind verschiedene Verfahren bekannt, urn ein DSBI- 
Enzym in Plastiden einzubringen oder dort zu exprimieren. Bei- 
spielhaft jedoch nicht einschr£nkend sind zu nennen: 

a) Nukleare Expression unter Verwendung plastidarer Transit- 
15 peptide 

Eine Expressionskassette kodierend fur ein DSBI-Enzym- 
Fusionsprotein kann in der dem Fachmann bekannten Weise 
konstruiert, in den Zellkern eingefiihrt und - optional - 

20 stabil in die chromosoraale DNA integriert werden. Fiir einen 

Transport in die Plastiden wird das DSBI-Enzym bevorzugt 
in Fusion mit einer Plastidenlokalisationssequenz (PLS) 
exprimiert. Verfahren, an sich nicht in den Plastiden lokali- 
sierte Proteine gezielt in die Plastiden zu transportieren, 

25 sowie verschiedene PLS-Sequenzen sind beschrieben (Klosgen RB 

und Weil JH (1991) Mol Gen Genet 225 (2) :297-304; Van Breuse- 
gem F et al. (1998) Plant Mol Biol 38 (3 ): 491-496) . Bevorzugt 
sind PLS, welche nach Trans lokat ion des DSBI-Enzyras in die 
Plastiden vom DSBI-Enzym-Teil enzymatisch abgespalten werden. 

30 Insbesondere bevorzugt ist die PLS, die von der plastidaren 

Nicotiana tabacum Transketolase oder einem anderen Transit- 
peptid (z.B. dem Transitpeptid der kleinen Untereinheit 
der Rubisco oder der Ferredoxin NADP Oxidoreduktase als 
auch der Isopentenylpyrophosphat Isomerase-2) oder dessen 

35 funktionellem Aquivalent abgeleitet ist. Fur die nukleSre 

Expression sind im Prinzip alle Promotoren geeignet, die eine 
Expression in Pflanzen ermdglichen. Beispiele sind weiter 
unten gegeben. Bevorzugt sind konstitutive Promotoren wie der 
35S Promotor des CaMV oder der Nitrilase-1 Promotor des nitl 

40 Gens aus Arabidopsis (GenBank Acc.-No. : Y07648.2, Nukleotide 
2456 bis 4340; Hillebrand H et al. (1998) Plant Mol Biol 36 
(l):89-99; Hillebrand H et al. (1996) Gene 170 (2) :197-200) . 
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Bevorzugte PLS Sequenzen sind: 

i) das Transitpeptid der Isopentenylisomerase (IPP) aus 
Arabidopsis (GenBank Acc. -No. : NCL003074; Nukleotide 

5 604657 - 604486) 

ii) Transitpeptide abgeleitet von der kleine Untereinheit 
(SSU) der Ribulosebisphosphatcarboxylase (Rubisco ssu) 
aus beispielsweise Erbse, Mais, Sonneblume oder 

10 Arabidopsis. 

Arabidopsis thaliana : GenBank Acc . -No . : z . B . 
AY054581, AY054552; 

15 - Erbse, GenBank Acc .-No. : z.B. X00806, Nukleotide 

1086 bis 1256; X04334, X04333 (Hand JM (1989) 
EMBO J 8 (11) :3195-206) . Hier besonders bevorzugt: 
Expressionskassette und Transitpeptid (Erbse, rbcS3A) 
aus Vektor pJITH7 (Guerineau F (1988) Nucleic Acids 

20 Res 16(23) : 11380. Besonders bevorzugt ist die Peptid- 

seguenz gem&£ SEQ ID NO: 35. Am meisten bevorzugt far 
die Verwendung zur Konstruktion von entsprechenden 
Expressionskonstrukten ist die NukleinsSuresequenz 
gemafc SEQ ID NO: 34. 



25 



Mais, GenBank Acc. -^No. : z.B. S42568, S42508 



Sonnenblume, GenBank Acc. -No.: Y00431, Nukleotide 301 
bis 465. 

30 

iii) Transitpeptide abgeleitet von Genen der pf lanzlichen 
Fettbiosynthese wie das Transitpeptid des plastidSren 
*Acyl Carrier Protein" (ACP) (z.B. die Arabidopsis 
thaliana beta-ketoacyl-ACP synthetase 2; GenBank Acc- 
35 No.: AF318307), die Stearyl-ACP-Desaturase, p-Ketoacyl- 

ACP Synthase oder die Acyl-ACP-Thioesterase (z.B. 
A. thaliana mRNA for acyl-(acyl carrier protein) thio- 
esterase: GenBank Acc . -No . : Z36911) . 

40 iv) das Transitpeptid der GBSSI ("Starch Granule Bound 

Synthase I") 

v) das Transitpeptid der LHCP II Gene. 

45 Besonders bevorzugt ist die PLS der plastid&ren Transketolase 

aus Tabak (SEQ ID NO: 36). Zur Expression entsprechender 
Fusionsproteine k6nnen im Rahmen dieser Erf indung ver- 
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schiedene PLS-Nukleinsaurekassetten in den drei Lese- 
rastern als Kpnl/RamHI Fragment verwendet werden (der 
Translationsstart (ATG-Kodon) ist in der Ncol Schnittstelle 
lokalisiert) (pTP09 SEQ ID NO: 37; pTPIO SEQ ID NO: 38; pTPll 
5 SEQ ID NO: 39) . 



Ein weiteres Beispiel fiir eine vorteilhaft einzusetzende PLS 
ist das Trans itpept id der plastidSren Isopentenylpyrophosphat 
Isomerase-2 (IPP-2) aus Arabidopsis thaliana (SEQ ID NO: 40). 

10 Ganz besonders bevorzugt kdnnen die NukleinsSuresequenzen 

kodierend fur drei Kassetten (entsprechend den drei Lese- 
rastern) der PLS der Isopentenylpyrophosphat Isomerase-2 
(IPP-2) aus Arabidopsis thaliana verwendet werden (EcoRV/ 
Sall-Kassetten mit ATG; IPP-9 SEQ ID NO: 41; IPP-10 

15 SEQ ID NO: 42; IPP-11 SEQ ID NO: 43) . 



Die erfindungsgemSSen NukleinsSuren k6nnen synthetisch her- 
gestellt oder naturlich gewonnen sein oder eine Mischung aus 
synthetischen und naturlichen NukleinsSure-Bestandteilen ent- 
20 halten, sowie aus verschiedenen heterologen Genabschnitten 

verschiedener Organismen bestehen. 

Die fur das Transitpeptid kodierende Sequenz kann ganz oder 
teilweise die Peptidsequenz des Ursprungsproteins umfassen. 

25 Eine exakte Bestiiranung der fur den Transport essentiellen 

Aminos&urereste ist nicht erforderlich, solange die Funktio- 
nalitat der PLS - nSmlich der Transport in die Plastiden - 
gewahrleistet ist, und die Funktion des DSBI-Enzyms nicht 
g&nzlich zerst6rt wird. Ganz besonders bevorzugt sind die 

30 nachfolgenden PLS-Sequenzen: 



PLS1: N-MASSSSLTLSQAILSRSVPRHGSASSSQLSPSSLTFSGLKSNPNITTSRRR 
TPSSAAAAAWRSPAIRASAATETIEKTETAGS-C (SEQ ID NO: 36). 
Entspricht der PLS der plastidelren Transketolase aus 
35 Tabak. 



PLS2: N-MSASSLFNLPLIRLRSLALSSSFSSFRFAHRPLSSISPRKLPNFRAFSGTA 
MTDTKDGSRVDM-C (SEQ ID NO: 40). Entspricht der PLS 
der Isopentenylpyrophosphat Isomerase-2 (IPP-2), 
40 wobei das letzte Methionin bevorzugt das Start- 

Methionin des DSBI Enzymes ist. 



45 



Die Homing-Endonuklease gem&£ SEQ ID NO: 69 stellt ein bevor- 
zugtes Fusionsproteine aus der nativen I-Ppo I Nuklease und 
der der IPP-Plastidenlokalisationssequenz dar. Bevorzugt 
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wird dieses Protein durch die Sequenz mit der SEQ ID NO: 68 
kodiert . 

Fusionsproteine aus PLS und DSBI-Enzym sind im Rahmen dieser 
5 Erfindung unter dem Begriff des DSBI-Enzyms subsumiert. Wird 

eine DSBI-Enzym nukleSr exprimiert, so wird unter dem DSBI- 
Enzym bevorzugt ein Fusionsprotein aus PLS und DSBI-Enzym 
verstanden. 

Ein weiterer Gegenstand der erfindung betrifft Fusionproteine 
10 aus DSBI-Enzymen mit Plastidenlokalisationssequenz (PLS) 

Sequenzen sowie Expressionkassetten enthaltend ein Fusions- 
protein aus einer Plastidenlokalisationssequenz (PLS) und 
einem DSBI-Enzym unter Kontrolle eines im pflanzlichen 
Zellkern funktionellen Promoters, Entsprechend geeignete 
15 Promotoren sind dem Fachmann bekannt und weiter unten be- 

schrieben. Die Expressionskassette kann weitere Elelemente, 
wie beispielsweise Transkriptionsterminatoren und/oder 
Selektionsmarker beinhalten. 

20 b) Expression in Plastiden 

Eine Expression in Plastiden kann auch durch direkte 
Einfuhrung einer Expressionskassette fur das DSBI-Enzym 
in Plastiden, ggf . Integration in die plastid&re DNA und 

25 Expression des DSBI-Enzyms erfolgen. In einer bevorzugten 

Aus ftihrungs form ist diese Expressionskassette in dem die 
Insert ionssequenz umfassenden Transformationskonstrukt 
enthalten. N 
Dabei k6nnen zum einen spezifische Plastiden- oder Chromo- 

30 plas ten-Promo tor en - wie unten im Detail beschrieben - zum 

Einsatz kommen. Eine gezielte plastidare Expression kann 
auch erreicht werden, wenn man zum Beispiel einen viralen, 
bakteriellen oder Bakteriophagen Promoter verwendet, die 
resultierende Expressionskassette in die plastidSre DNA ein- 

35 bringt und die Expression dann durch die korrespondierende 

virale, bakterielle oder Bakteriophagen RNA-Polymerase 
induziert. Die korrespondierende RNA-Polymerase kann wiederum 
auf verschiedene Art und Weise - bevorzugt durch nukle&re 
Transformation als Fusionsprotein mit einer PLS - in die 

40 Plastiden eingebracht werden. Entsprechende Verfahren sind 

beschrieben (WO 95/16783, WO 97/06250, US 5,925,806). Das 
Einbringen in Plastiden wird bevorzugt mittels Mikroinjektion 
und besonders bevorzugt mittels Partikelbeschuss durch- 
gef Ohrt . 

45 



WO 03/054189 



PCT/EP02/14302 



25 

c) Einbringen als RNA 

Das DSBI-Enzym kann auch durch Einfuhrung der fur das DSBI- 
Enzym kodierenden - beispielsweise in vitro erzeugten - 
5 mKNA z.B. uber Mikroinjektion, Partikel-Bombardierung (bio- 

listische Verf ahren) , Polyethylenglykol- oder Liposomen-ver- 
mittelte Trans fekt ion in Plastiden eingebracht werden. Diese 
Ausfiihrungsform ist vorteilhaft, da hier keine DSBI-Enzym 
kodierenden Sequenzen im Plastom oder Genom verbleiben. 
10 Bevorzugt wird die das DSBI-Enzym kodierende RNA durch in 

vitro Transkription in der dem Fachmann bekannten Weise 
hergestellt . 

d) Einbringen als Protein 

15 

Das DSBI-Enzym kann direkt beispielsweise uber Mikro- 
injektion, Partikel-Bombardierung (biolistische Verfahren), 
Polyethylenglykol-Transfektion oder Liposomen-vermittelte 
Transfektion in Plastiden eingebracht werden. Diese 
20 Ausfxihrungsform ist vorteilhaft, da hier keine DSBI-Enzym 

kodierenden Sequenzen im Plastom oder Genom verbleiben. Ein 
entsprechendes Verfahren ist beispielsweise beschrieben bei 
Segal DJ et al. (1995) Proc Natl Acad Sci USA 92:806-810. 

25 Das DSBI-Enzym kann als Fusionsprotein mit dem VirE2 oder 

VirF Protein eines Agrobakterium sowie einer PLS in Pf lanzen- 
zellen eingeschleust werden. Entsprechende Verfahren sind 
beispielsweise fiir die Cre-Rekombinase beschrieben (Vergunst 
AC et al. (2000) Science 290:979-982). Diese Ausfuhrungs- 

30 form ist vorteilhaft, da hier keine DSBI-Enzym kodierenden 

Sequenzen im Genom verbleiben. 

Natiirlich sind auch Kombinationen der oben beschriebenen M6glich- 
keiten denkbar. 

35 

Bevorzugt ist die Expressionskassette fiir das DSBI-Enzym auf der 
Insertionssequenz oder dem Transf ormationskonstrukt enthalten. 

Bevorzugt wird das DSBI-Enzym gleichzeitig mit oder nach der Ein- 
40 fuhrung der Insertionssequenz in die Plastiden eingebracht bzw. 
aktiviert. Die Expression bzw. Aktivierung am richtigen Ort und 
zur richtigen Zeit kann durch verschiedene Ansatze sichergestellt 
werden: 



45 
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a) Induzierbare Expression 

Die Expression eines DSBI-Enzym kann unter Verwendung eines 
induzierbaren Promotor, bevorzugt eines chemisch induzier- 
5 baren Promotors, gesteuert werden. Dazu kann beispielsweise 

die ftir das DSBI-Enzym kodierende Expressionskassette stabil 
in die plastidare oder nukle&re DNA einer Masterpf lanze 
trans formiert werden. Erfolgt die Transformation in das Kern- 
genom, so muss - wie oben beschriebene - die subzellulSre 

10 Lokalisation durch geeignete PLS-Transitpeptide sicher- 

gestellt werden. Kurz vor oder wShrend der Transformation mit 
der Insertionssequenz oder dem Transf ormationskonstrukt wird 
dann in Abh&ngigkeit von dem geweihlten induzierbaren System 
die Expression des DSBI-Enzyms durch Applikation des ent- 

15 sprechenden Induktors eingeschaltet . Dem Fachmann sind 

verschiedene Verfahren oder Promotoren zur induzierten 
Expression bekannt. Als Stimulus kSnnen chemische Substanzen 
oder auch physikalische Stimuli wie beispielsweise erhohte 
Temperatur oder Verwundung etc. fungieren. Verschiedene 

20 Beispiele sind weiter unten beschrieben. 

b) Induzierbare Aktivitat 

( 

Das DSBI-Enzym kann bereits in den Plastiden der Master- 

25 pflanze vorliegen, wenn die Aktivitat durch geeignete 

Techniken erst zum gewahlten Zeitpunkt etwa durch Zugabe 
chemischer Substanzen induziert wird. Entsprechende Verfahren 
sind ftir sequenzspezif ische Rekombinasen beschrieben (Angrand 
PO et al. (1998) Nucl Acids Res 26 (13) :3263-3269; Logie C und 

30 Stewart AF (1995) Proc Natl Acad Sci USA 92 (13 ): 5940-5944 ; 

Imai T et al. (2001) Proc Natl Acad Sci USA 98 (1) :224-228) . 
Bei diesen Verfahren werden Fusionsproteine aus dem DSBI- 
Enzym und der LigandenbindedomSne eines Steroidhormon- 
rezeptors (z.B. des humanen Androgenrezeptors, oder mutierte 

35 Varianten des humanen Estrogenrezeptors wie dort beschrieben) 

eingesetzt. Die Induktion kann mit Liganden wie beispiels- 
weise Estradiol, Dexamethason, 4-Hydroxytamoxif en oder 
Raloxifen erfolgen. 

40 Manche DSBI-Enzyme sind als Dimer (Homo- oder Heterodimer) 

aktiv (I-Crel bildet ein Homodimer; I-Ppol bildet Homodimer, 
Flick KE et al . (1998) Nature 394: 96-101). Allgemein neigen 
Enzyme der LAGLIDADG Familie dazu, Homodimere zu bilden, wenn 
sie je Monomer nur ein LAGLIDADG Motiv enthalten (Jurica MS & 

45 Stoddard BL (1999) Cell Mol Life Sci 55:1304-1326; beispiel- 

haft sei I-Ceul genannt) . Eine Dimerisierung kann induzierbar 
gestaltet werden, indem beispielsweise die nattirlichen 
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Dimerisierungsdom&nen gegen die Bindungsdomane eines nieder- 
molekularen Liganden ausgetauscht werden. Zugabe eines 
dimeren Liganden bewirkt dann Dimerisierung des Fusions - 
proteins. Entsprechende induzierbare Dimerisierungsverfahren 
5 als auch die Herstellung der dimeren Liganden sind beschrie- 

ben (Amara JF et al. (1997) Proc Natl Acad Sci USA 94(20): 
10618-1623; Muthuswamy SK et al. (1999) Mol Cell Biol 19(10): 
6845-6857; Schultz LW und Clardy J (1998) Bioorg Med Chem 
Lett 8(l):l-6; Keenan T et al. (1998) Bioorg Med Chem. 
10 6(8) :1309-1335) . 

c) Cotransfektion 

Bevorzugt wird die Expressionskassette kodierend ftir das 
15 DSBI-Enzym gleichzeitig mit der Insertionssequenz in die 

Plastiden eingebracht. Dabei konnen die Expressionskassette 
fiir das DSBI-Enzym und die Insertionssequenz auf einem DNA- 
Molekiil oder auf zwei getrennten vorliegen. Bevorzugt liegen 
die beiden Sequenzen auf einem DNA-Molekiil zusammen vor, so 
20 dass die Expressionskassette in dem die Insertionssequenz 

umfassenden Transformationskonstrukt enthalten ist. 

Dabei wird in einer besonders bevorzugten Ausftihrungsf orm, 
nachdem homoplastome Pflanzen regeneriert wurden, die Sequenz 
25 kodierend ftir das DSBI-Enzym aus dem Genom der transformier- 

ten Plastiden wieder entfernt. Dem Fachmann sind dazu ver- 
schiedene Verfahren bekannt, die weiter unten im Detail 
beschrieben sind. 

30 Manche der oben beschrieben DSBI-Enzyme (insbesondere Homing 
Endonukleasen) konnen in dem bevorzugt genutzten Zwischenwirt 
E. coli Erkennungs sequenz en aufweisen. Da zudem manche 
Expressionskassetten zur Expression in Plastiden auch in E. coli 
funktionell sind, wird bevorzugt die Expression des DSBI-Enzyms 

35 in E. coli auf verschiedene dem Fachmann gel&ufige Art ver- 
hindert, um w&hrend der Amplif ikation der Expressionskassette 
etwaige nachteilige Effekte auf E.coli zu vermeiden. So kSnnen 
beispielsweise mehrere, aufeinander folgende fiir E. coli seltene 
Codons (z.B. die fiir Arginin kodierenden Kodons AGA und AGG) in 

40 den Leserahmen des DSBI-Enzyms einfiigt werden. Dies verhindert 
die Expression in E. coli, ermGglicht jedoch weiterhin - aufgrund 
der unterschiedlichen Kodonnutzung - eine Expression in den 
Plastiden. Alternativ konnen Promotoren genutzt werden, die nicht 
in E. coli wohl aber in den Plastiden h5herer Pflanzen aktiv sind 

45 (z.B. Promotoren der nukle&r kodierten plastid&ren RNA-Poly- 
merasen [NEP-Promotoren; s.u.]). Eine bevorzugte Methode ist 
die Verwendxing von Promotoren, die weder von den Plastiden noch 
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von E. coli erkannt werden (z.B. virale oder Bakteriophagen 
Promotoren) , die erst durch das gleichzeitige Vorhandensein der 
entsprechenden viralen/Bakteriophagen RNA Polymerase funktionell 
werden. Entsprechende Verfahren sind dem Fachmann bekannt und 
5 unten beschrieben. Ferner ware es denkbar, die entsprechenden 
DSB-Erkennungssequenzen in E. coli zu zerstOren oder einen 
anderen Wirt zu benutzen, der keine DSB-Erkennungssequenzen 
ftir das jeweilige DSBI-Enzym besitzt. Des weiteren ist es denk- 
bar und vorteilhaft, die kodierende Region des DSBI-Enzyms zur 

10 Amplifikation in E. coli promotorlos vorliegen zu haben. In 

diesem Fall ist die ftir das DSBI-Enzym kodierende Sequenz bevor- 
zugt auf einem Plasmid enthalten, welches in das plastidare Genom 
der zu trans f ormierenden Pflanze integrieren kann. Dabei kann der 
Integrationsort derart gewahlt werden, dass das Gen kodierend 

15 ftir das DSBI-Enzym unter die Kontrolle eines natiirlicherweise 
oder ktinstlich eingeftigt im Plastom vorhandenen Promotors gelangt 
und es daher in den Plastiden zur Expression des DSBI-Enzyms 
kommt. In einer weiteren bevorzugten Aus ftthrungs form wird dafur 
gesorgt, dass das Gen kodierend fur das DSBI-Enzym wieder aus dem 

20 Plastom deletiert werden kann (siehe unten) . Dartiber hinaus ist 
es moglich, eine Verkniipfung zwischen einem Promotor und einem 
DSBI-Enzym zu erstellen, indem ein solcher in vitro mittels dem 
Fachmann gelaufige PCR Techniken stromaufwarts des of fenen Lese- 
rahmens angeftigt wird. Das PCR Produkt kann dann genutzt werden, 

25 urn es in die pf lanzlichen Plastiden einzubringen. Aufeerdem k$nnen 
nicht-funktionelle Teile einer Expressionskassette fUr ein DSBI- 
Enzym erstellt und in E. coli amplifiziert werden, wenn diese 
nach dem Einbringen in pf lanzliche Plastiden miteinander rekombi- 
nieren (beispielsweise durch homologe Rekombination in uberlap- 

30 penden Bereichen der nicht-funktionellen Anteile der Expressions- 
kassette) und so eine funktionelle Expressionskassette ergeben. 

"Erkennungssequenz zur gezielten Induktion von DNA-Doppelstrang- 
brttchen" (infolge w DSB-Erkennungssequenz" fttr Doppelstrangbruch- 

35 Erkennungssequenz) meint allgemein solche Sequenzen, die unter 
den Bedingungen in den Plastiden der jeweils verwendeten pf lanz- 
lichen Zelle oder Pflanze die Erkennung und Spaltung durch ein 
DSBI-Enzym erlauben. Besonders bevorzugt sind DSB-Erkennungs- 
sequenzen fur Homing-Endonukleasen, die natiirlicherweise in Mito- 

40 chondrien oder Kern anderer Organismen kodiert sind. Es konnen 
auch DSB-Erkennungssequenzen der Homing-Endonukleasen genutzt 
werden, die aus Plastiden (beispielsweise von Griinalgen) stammen. 
Bevorzugt ist die DSB-Erkennungssequenz singular in der plasti- 
dSren DNA, d.h. ein Doppelstrangbruch wird nur an der so vor- 

45 definierten Stelle erzeugt. Es sind jedoch auch F&lle denkbar, 
bei denen mehr als eine DSB-Erkennungssequenz im Plastom 
vorhanden ist. Dies ist insbesondere der Fall, wenn die DSB- 
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Erkennungssequenz in duplizierten Genen (z.B. in invertierten 
"Repeats") lokalisiert ist. Im letzteren Fall liegen mehr als 
eine identische DSB-Erkennungssequenz vor, ihr Kontext ist jedoch 
identisch, so dass auch hier eine gezielte Insertion erfolgt. Es 
5 ist sogar bevorzugt, dass die Integration in alle Kopien erfolgt, 
so dass auch ein Schnitt in alien Kopien erforderlich ist. DSB- 
Erkennungssequenzen, die zwar mehr als einmal in einem Plastom 
auftreten, jedoch im gleichen plastomen Kontext lokalisiert 
sind (z.B. in "Repeats* Oder Genduplikationen) sind im Rahmen 
10 dieser Erf indung unter dem Begrif f der singularen DSB-Erkennungs- 
sequenzen subsumiert. 

Bevorzugt ist die eingesetzte Pflanze oder von dieser abgeleitete 
Zelle beziiglich der DSB-Erkennungssequenz iiberwiegend homoplastom 
15 oder homotransplastom, d.h. dass die xiberwiegende Anzahl der in 
einem Plastid enthaltenen plastidaren DNA-Molektile diese DSB- 
Erkennungssequenz aufweisen. Solche Pflanzen werden auch als 
Masterpflanzen im Rahmen dieser Erf indung bezeichnet. 

20 Prinzipiell kSnnen zwei Arten von DSB-Erkennungssequenzen genutzt 
werden: 

a) Naturliche, endogene DSB-Erkennungssequenzen 

25 Wie im Rahmen dieser Erf indung gezeigt werden konnte, ent- 

halten die Plastome hfiherer Pflanzen verschiedene Sequenzen, 
die als Erkennungssequenzen fiir DSBI-Enzyme (beispielsweise 
Homing-Endonukleasen) fungieren kdnnen, auch wenn ftir hahere 
Pflanzen bislang keine solchen Endonukleasen nachgewiesen 

30 werden konnten. Solche DSB-Erkennungssequenzen k6nnen 

mittels Durchmusterung der plastid&ren DNA-Sequenz unter 
Verwendung der bekannten DSB-Erkennungssequenzen (beispiels- 
weise der in Tabelle 2 beschriebenen) identif iziert werden. 
Das plastidare Genom verschiedener Pflanzen ist bekannt 

35 ( ht tp : / /megasun . bch . umon t real . ca / ogmp /pro j ec t s / other / 

cp_list.html). Berichtet sind die Sequenzen der Plastome von 

Arabidopsis thaliana (Sato S et al. (1999) DNA Res. 6 
<5):283-290) (GenBank Acc. -No. : AP000423; NCBI Acc.-No. 
40 NC_000932) 

Epifagus virginiana (Beechdrops; Wolfe KH et al. (1992) J 
Mol Evol 35(4) :304-317; NCBI Acc.-No.: NC_001568; GenBank 
Acc.-No. : M81884) 
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Lotus japonicus (Kato T et al. (2000) DNA Res 7(6):323- 
330;NCBI Acc.-No.: NC_002694; GenBank Acc . -No. : AP002983 ) 

Oryza sativa (Reis) (Hiratsuka J et al. (1989) Mol Gen 
5 Genet 217 (2-3) :185-194; NCBI Acc.-No.: NC_001320; GenBank 

Acc.-No: X15901), 

Marchantia polymorpha (Liverwort; Ohyama K et al. (1988) 
J Mol Biol 203(2) :281-298; Yamano Y et al. (1984) Nucl 
10 Acids Res 12 ( 11) : 4621-4624; GenBank Acc.-No.: X04465 und 

Y00686; NCBI Acc.-No.: NC_001319) 

Nicotiana tabacum (Tabak) (GenBank Acc.-No.: Z00044 und 
S54304; NCBI Acc.-No.: NC_001879; Shinozaki K et al. 
15 (1986) EMBO J 5:2043-2049) 

Oenothera elata ssp. hookeri (Monterey evening primrose; 
GenBank Acc.-No.: AJ271079; NCBI Acc.-No.: NC_002693; 
Hupfer H et al. (2000) Mol Gen Genet 263 (4) : 581-585) 



20 



30 



Medicago truncatula (Gen Bank Acc.-No.: AC093544) 



Pinus thunbergii (black pine; Tsudzuki J et al. (1994) 
Curr Genet 26 (2) :153-158; NCBI Acc.-No. :NC_00 1631; 
25 GenBank Acc.-No. : D17510) 

Spinacia oleracea (GenBank Acc.-No.: AJ400848 J01442 
M12028 M16873 M16878 M27308 M55297 X00795 X00797 X01724 
X04131 X04185 X05916 X06871) 



Triticum aestivum (Weizen; GenBank Acc.-No.: AB042240; 
NCBI Acc.-No.: NC_002762) und 



Zea mays (GenBank Acc.-No.: X86563; NCBI Acc.-No.: 
35 NC_001666) 

Dartiber hinaus kdnnen weitere Plastome sequenziert werden, 
um auch dort DSB-Erkennungsstellen zu identif izieren. Es 
ist im allgemeinen ausreichend, hoch konservierte Regionen 
40 aus dem Plastom durch dem Fachmann gelfiufige PCR-Methoden 

zu isolieren und nur diese zu sequenzieren. 

Ferner konnen nattlrliche, endogene DSB-Erkennungsstellen 
experimentell ermittelt werden, indem man beispielsweise die 
45 plastidare DNA isoliert (z.B. nach Mariac P et al. (2000) 

BioTechniques 28:110-113), die zu betrachteten Fragmente des 
Plastidengenoms mittels PCR amplifiziert oder synthetische 
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Fragmente nutzt und mit dem jeweiligen DSBI-Enzym eine 
Restriktionsanalyse durchflihrt. Diese wird bevorzugt unter 
Bedingungen durchgefuhrt, wie sie im Plastid einer hdheren 
Pflanze vorliegen. 

5 

Die im Rahmen dieser Erfindung identif izierten und in 
Tabelle 1 beschriebenen endogenen DSB-Erkennungss sequenz en 
fttr natiirliche Homing-Endonukleasen liegen darxiberhinaus 
in den konservierten Regionen des Plastoms, so dass - ins- 

10 besondere unter Beriicksichtigung der gegebenen Variabilit&t 

der entsprechend genannten Homing-Endonukleasen bezuglich 
ihrer jeweiligen Erkennungssequenzen - davon ausgegangen 
werden kann, dass diese Erkennungssequenzen nahezu universell 
in alien Plastomen h6herer Pflanzen vorkommen. Hinter den in 

15 Tabelle 1 angegebenen Positionen verbirgt sich jeweils die 

angegebene Sequenz und die reverskompliment&re, da alle in 
Tabelle 1 angegebenen Erkennungsregionen in den n Inverted Re- 
peats" des Plastidengenoms lokalisiert sind. Von den in Ta- 
belle 1 genannten Homing-Endonukleasen sind besonders bevor- 

20 zugt I-Cpal, I-Ceul, I-Chul, I-CpaII und I-Crel. 

Die so identif izierten Erkennungssequenzen kSnnen fur die 
Insertion von Fremd-DNA genutzt werden, indem durch Ein- 
fiihrung des entsprechenden DSBI-Enzyms ein Doppelstrangbruch 
25 erzeugt wird. Sollte die DSB-Erkennungs sequenz in einer hoch- 

konservierten Region innerhalb eines Gens des Organellen- 
genoms liegen, so wird die Fremd-DNA bevorzugt in Form eines 
selbstspleifienden Introns insertiert, was die Rekonstitution 
der mRNA des betroffenen Gens erm6glicht (s.u.). 

30 

Dem Fachmann sind ferner Verfahren bekannt, nach denen eine 
beliebige endogene Sequenz als Erkennungssequenz fttr chimare, 
mutierte oder kunstliche Endonukleasen fungieren kann, 
indem deren DNA-Erkennungsregion - beispielsweise durch 
35 Modifizieren einer an eine Endonuklease-Domane fusionierten 

Zink-Finger-DomSne oder Modifizieren der RNA-Sequenz eines 
Gruppe II Intron-RNA-Protein Komplexe - gezielt verandert 
wird (s.o.; WO 96/06166, Bibikova M et al. (2001) Mol Cell 
Biol 21:289-297) . 

40 
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Tab 1: Bevorzugte, endogene Schnittstellen in den plastidaren Genomen 
von Tabak, Weizen, Reis, Mais und Arabidopsis. c=konvplementar. AccNo: 
GenBank Accession-Number (http://www.ncbi.nlm.nih.gov/) . 
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DarOber hinaus liegen singulare Schnittstellen von 
Restriktionsendonukleasen im Plastidengenom vor. Diese 
bef inden sich jedoch meist in weniger hoch konservierten 
Regionen und sind daher nicht unbedingt universell in alien 
5 Pflanzenarten nutzbar. Beispielhaft sind zu nennen: 

a) Das Enzym Sfil hat im Plastidengenom von Arabidopsis 
(GenBank Acc.-No.: AP000423) an der Position 40846-40858 
mit der Sequenz GGCCTTTATGGCC eine singul&re Erkennungs- 
stelle. 

b) Im Plastidengenom von Mais (GenBank Acc.-No.: X86563) 
gibt es eine singulare Schnittstelle fur das Enzym AscI 
an der Position 42130-42137 mit der Sequenz GGCGCGCC. 

c) Im Plastidengenom von Reis (GenBank Acc.-No.: X159019) 
gibt es eine singul&re Schnittstelle fur das Enzym Sgfl 
an der Position 77309-77316 mit der Sequenz GCGATCGC 
sowie far das Enzym AscI an der Position 39776-39783 
mit der Sequenz GGCGCGCC. 

d) Im Plastidengenom von Tabak (Accession Z00044) gibt es 
je eine singulare Schnittstelle fur das Enzym Sfil an 
der Position 42475-42487 mit der Sequenz GGCCTTTATGGCC, 
fur das Enzym SgrI an der Position 78522-78529 mit 
der Sequenz CACCGGCG, sowie fur das Enzym Pmel an der 
Position 120895-120902 mit der Sequenz GTTTAAAC. 

e) Im Plastidengenom von Weizen (Accession AB042240) gibt es 
je eine singul&re Schnittstelle fur das Enzym Pmel an der 
Position 59331-59338 mit der Sequenz GTTTAAAC, far die 
Enzyme Narl, KanI, Ehel und Bbel eine singulcLre Schnitt- 
stelle an der Position 41438-41443 mit der Erkennungs- 
se<jaenz GGCGCC, sowie fur das Enzym Sfil eine Erkennungs- 
region an der Position 112656-112668 mit der Sequenz 
GGCCCAGGGGGCC. 

All diese Pflanzen mit endogenen, naturlichen DSB-Erkennungs- 
sequenzen stellen quasi natarlich vorkommende "Master- 
pflanzen" dar. Bei ihnen ist die DSB-Erkennungssequenz natar- 
licherweise homoplastom vorhanden. Dies erObrigt die Ein- 
fuhrung und Selektion kOnstlicher DSB-Erkennungssequenzen. 
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b) Kunstlich eingeftihrte DSB-Erkennungssequenzen 

Dem Fachmann ist bewusst, dass die in eine Masterpf lanze ein- 
gebrachte Erkennungsregion ftir ein selten schneidendes Enzym 
5 nicht nattirlich sein muss. Prinzipiell kann jede Erkennungs- 

sequenz eines beliebigen DSBI-Enzyms an jede beliebige Stelle 
der plastidSren DNA insertiert werden. Die Herstellung 
erfolgt bevorzugt unter Verwendung eines Konstrukt zur 
Insertion der DSB-Erkennungssequenz (infolge DSBE-Konstrukt) . 

10 Bevorzugt umfasst das DSBE-Konstrukt einen Selektionsmarker, 

um die zur Erzeugung entsprechender Masterpf lanzen erforder- 
liche Selektion transplastomer Pflanzen mit der erfolgreich 
inser tier ten DSB-Erkennungssequenz zu erleichtern. Dem Fach- 
mann sind verschiedene Selektionsmarker bekannt, die eine 

15 Selektion von Plastiden erm5glichen (s.u.). Bevorzugt sind 

aadA, nptll oder RADH, wobei aadA besonders bevorzugt ist. 
Die Selektion erfolgt beispielsweise mit Hilfe des dem Fach- 
mann bekannten "segregation and sorting" Prozess (beispiel- 
haft unter Beispiel 4 beschrieben) . Der Selektionsmarker ist 

20 bevorzugt so konstruiert, dass eine nachfolgende Deletion aus 

dem Plastom ermoglicht wird. Entsprechende Verfahren sind dem 
Fachmann bekannt und unten beschrieben. 

Bevorzugt wird so zunSchst eine beziiglich der insertierten 
25 DSB-Erkennungssequenz homotransplastome Pf lanze erzeugt, die 

eine DSB-Erkennungssequenz in alien oder der Oberwiegenden 
Anzahl der Plastiden der betrachteten Pf lanze besitzen. 
Solche Pflanzen konnen vorteilhaft als Masterpf lanzen ein- 
gesetzt werden. 

30 

Das DSBE-Konstrukt kann neben dem Selektionsmarker weitere 
Sequenzen enthalten. Diese kSnnen beispielsweise weitere 
regulatorische Elemente fur die Expression der infolge ein- 
zuftihrenden Insert ionssequenzen enthalten. Der im Rahmen 
35 des Konstruktes zur Insertion der DSB-Erkennungssequenz 

eingeftihrte Selektionsmarker wird in einer bevorzugten Aus- 
fuhrungsform nach Erhalt der homoplastomen Masterpf lanze 
durch dem Fachmann bekannte Verfahren deletiert (s.u.) . 

40 In einer bevorzugten Aus ftthrungs form umfasst das DSBE- 

Konstrukt zur Ermoglichung einer ortsspezif ischen Insertion 
an mindestens einer, bevorzugt an beiden Seiten der DSB- 
Erkennungssequenz weitere flankierende Sequenzen, die eine 
ausreichende LSnge und Homologie zu entsprechenden Ziel- 

45 sequenzen im Plastom haben, um eine ortsspezif ische Insertion 

mittels homologer Rekombination zu gew&hrleisten. 
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Aufgrund der Vielzahl der im Stand der Technik beschriebenen 
DSBI-Enzyme mit definierten Erkennungssequenzen, ist es mSglich 
imd bevorzugt, Master-Pf lanzen zu erzeugen, die mehrere ver- 
schiedene singul&re DSB-Erkennungssequenzen in ihr plastid&res 
5 Genom eingebaut haben. 

Beispielhaft aber nicht einschr&nkend seien dabei in nach- 
folgender Tabelle 2 die Erkennungssequenzen fttr die jeweiligen 
aufgefuhrten DSBI-Enzyme genannt. 

10 

Tabelle 2: Erkennungssequenzen und Herkunftsorganismus von DSBI- 
Enyzmen gibt innerhalb einer Erkennungssequenz die Schnitt- 

stelle des DSBI-Enzyms an.) 



15 



30 



35 



40 



45 



DSBI-Enzym 


Herkunfts- 
organismus 


Erkennungssequenz 


I-Anil 


nidulans 


5 ' -TTGAGCSAGGTT * TCTCTGTAAATAANNNNNNNNNNNNNNN 
3 ' -AACTCCTCCAAAGAGACATTTATO 


I-Cvul 


Chlorella 
vulgaris 


5 ' -CTGGGTTCAAAACGTCGTGA^GACAGTTTGG 
3 ' -GACCCAAGTTTTGCAG A CACTCTGTCAAACC 


I-CsmI 


Chlamydomonas 
smithii 


5 ' -GTACTAGCATGGGGTCAAATGTCTTTCTGG 


I-Cmoel 


Chi amydomonas 
moewusii 


5 ' -TCGTAGCAGCT^CACGGTT 
3 ' -AGCATCG* TCGAGTGCCAA 


I-Crel 


Chi amy domonas 
reinhardtii 


5 ' -CTGGGTTCAAAACGTCGTGA^ GAC AGTTTGG 
3 ' -GACCCAAGTTTTGCAG A CACTCTGTCAAACC 


I-Chul 


Chi amydomonas 
humicola 


5 ' -GAAGGTTTGGCACCTCG^ATGTCGGCTCATC 
3 ' -CTTCCAAACCGTG" GAGCTACAGCCGAGTAG 


I-Cpal 


Chi amydomonas 

pallidostig- 

matica 


5 ' -CGATCCTAAGGTAGCGAA^ATTCA 
3 ' -GCTAGGATTCCATC A GCTTTAAGT 


I-CpaII 


Chi amydomonas 

pallidostig- 

matica 


5 ' -CCCGGCTAACTC A TGTGCCAG 
3 ' -GGGCCGAT A TGAGACACGGTC 


I-Ceul 


Chlamydomonas 
eugametos 


5 ' - CGTAAC TAT AACGGTC CTAA* GGTAGCGAA 
3 ' -GCATTGATATTGCCAG A GATTCCATCGCTT 


I-Dmol 


Desulfuro- 

coccus 

mobilis 


5 ' -ATGCCTTGCCGGGTAA A GTTCCGGCGCGCAT 
3 ' -TACGGAACGGCC * CATTCAAGGCC GCGCGTA 


I-Scel 


Saccharomyces 
cerevisiae 


5 ' - AGTTACGCTAGGGATAA* CAGGGTAATATAG 

3 ' -TCAATGCGATCCC ^TATTGTCCCATTATATC 

5 ' - TAGGGAT AA A CAGGGTAAT 

3 ' -ATCCC ^TATTGTCCCATTA ( "Core'-Sequenz ) 


I-SceII 


Saccharomyces 
cerevisiae 


5 * -TTTTGATTCTTTGGTC ACCC * TGAAGTATA 
3 ' - AAAACTAAGAAACC AG A TGGGACTTCATAT 


I-SceIII 


Saccharomyces 
cerevisiae 


5 ' - ATTGGAGGTTTTGGTAAC A T ATTT ATTACC 
3 ' -TAACCTCCAAAACC A ATTGATAAATAATGG 


I-SceIV 


Saccharomyces 
cerevisiae 


5 ' -TCTTTTCTCTTGATTA^GCCCTAATCTACG. 
3 ' - AGAAAAGAGAAC A TAATCGGGATT AGATGC 


I-SceV 


Saccharomyces 
cerevisiae 


5 ' - AATAATTTTCT A TCTTAGTAATGCC 
3 ' -TTATTAAAAGAAGAATCATTA^CGG 
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DSBI-Enzym 


Her kunf ts- 
organismus 


Erkennungssequenz 




I-SceVI 


Saccharomyces 
cerevisia© 


5 ' -GTTATTTAATG A TTTTAGTAGTTGG 
3 ' -CZAATAAATTACAAAATCATCA^ACC 


5 


I-SceVII 


Saccharomyces 
cerevisiae 


5 ' -TGTCACATTGAGGTGCACTAGTTATTAC 




Pl-Scel 


Saccharomyces 
cerevisiae 

X*" W» 4b W V fc-J JL Wlw 


5 ' -ATCTATGTCGGGTGC ^GGAGAAAGAGGTAAT 
■> * _ TAGATAPAGCP A PAPGPPTY^T T TTY ,, 'TV" , r , aT ,, 'TiA 


10 


F-Scel 


Saccharomyces 
cerevis iae 


5 ' -GATGCTGTAGGC A ATAGGC TTGGTT 
3 ' -CTACGACA A TCCGTATC , PGAAr , r , AA 


F-Scell 


Saccharomyces 
cerevisiae 


5 ' -CTTTCCGCAACA A GTAAAATT 
\ * -GAAAGGPG^TTGTTAT r P , T v rAA 




I-Llal 


Lactococcus 
lactis 


5 ' -C ACATCCATAAC A C ATATC ATTTTT 
3 ' — GTGTAGGTATTGGTATAG r PAA A AAA 


15 


I-Msol 


Monomastxx 
species 


5 ' -CTOGGTTCAAAACGTCGTGA^GACAGTTTGG 

3 ' — GAP(^r , AAn r T^TTGPAG A r' Ar ,r PT ,r TV^ r Pr , a a 

■J vjnvvvunnv) x x x x \3\<nu ^,av«, x\». x vs IVnAnLL 




I-NanI 


Naegleria 
andersoni 


5 ' - AAGTCTGGTGCCA A GCACCCGC 




I-NitI 


Naegleria 
italica 


5 ' -AAGTCTGGTGCCA" GCACCCGC 
3 ' -TTCAGAr , C A ArGGTrGTY2r^fir , G 


20 


I-Njal 


Naegleria 
jamiesoni 


5 ' -AAGTCTGGTGCCA A GCACCCGC 

J — 1 iVAUALL ACGCsTCCjTGGGCG 




I-PakI 


Pseudendoclo- 
nium akinetum 


5 ' -CTGGGTTCAAAACGTCGTGA^GACAGTTTGG 
3 ' -GACCCAAGTTTTGCAG A CACTCTGTCAAACC 




I-PorT 
x. rui x 


ry i ujja'w.uxuin 

organotrophic 


-> — UCvaAVjCUMjxAAGvivxF GTGTACGGG 
3 ' -CGCTCGGGCATT A CCCACACATGCCC 


25 




Physarum po- 
lycephalum 


D -xaaUTATvjaCTCx\.TTaA GGTAGCCAAAT 
3 ' - ATTGATACTGAGAG ~ AATTC CATCGGTTTA 




I-Ppol 


CTCTCTTAA A GGTAGC 
GAGAG a AATTPnATPG 


30 


I-Scal 


Saccharomyces 
capensis 


5 ' -TGTCAC ATTGAGGTGC AC T ~ AGTTATTAC 

3 1 — ACAGTGTAACTT'PAP^GTGATr'AATAATG 




I-Ssp6803I 


Synechocys t i s 
species 


5 ' -GTCGGGCT A CATAACCCGAA 
3 ' -CAGCCCGAGTA A TTGGGCTT 




Pl-Pful 


Pyrococcus 
furiosus vcl 


5 ' -GAAGATGGGAGGAGGG A ACCGGACTC AACTT 
3 ' -CTTCTACCCTCC A TCCCTGGCCTGAGTTGAA 


35 


Pl-PfuII 


Pyrococcus 
furiosus Vcl 


5 ' -ACGAATCCATGTGGAGA A AGAGCCTCTATA 
3 ' -TGCTTAGGTACAC A CTCTTCTCGGAGATAT 




Pl-Pkol 


Pyrococcus 

kodakaraensis 

KOD1 


5 ' -GATTTTAGAT A CCCTGTAr'P 
3 ' -CTAAAA A TCTAGGGACATGG 




Pl-PkoII 


Pyrococcus 
kodakaraens i s 
K0D1 


5 ' -CAGTACTACG A GTTAC 
3 ' -GTCATG A ATGCCAATG 




PI-Pspl 


Pyrococcus 
sp. 


5 ' - AAAATCCTGGCAAAC AGCTATTAT A GGGTAT 
3 ' -TTTTAGGACCGTTTGTCGAT ^ AATACCCATA 


45 


PI-Tful 


Thermococcus 

fumicolans 

ST557 


5 ' -TAGATTTTAGGT A CGCTATATCCTTCC 

3 ' -ATCTAAAA A TCCAGCGATATAGGAAGG ! 
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DSBI— Enzym 


Herkunfts- 
organ ismus 


Erkennungssequenz 


PI-TfulI 


Thermococcus 

fumicolans 

ST557 


5 ' -TAYGCNGAYACN* GACGGY TTYT 
3 ' -ATRCGNCT A RTGNCTGCCRAARA 


PI-Thyl 


Thermococcus 
hydrotherma- 
lis 


5 ' -TAYGCNGAYACN A GACGGYTTYT 
3 ' -ATRCGNCTARTGNCTGCCRAARA 


PI-Tlil 


Thermococcus 

X X LUI C* J- -1- O 


5 ' -TAYGCNGAYACNGACGG A YTTYT 
3 ' -ATRCfiNCTRTGNC^TGCCRAARA 


PI-Tlill 


Thermococcus 

X X \m wJL «X X O 


5 ' -AAATTGCTTGCAAACAGCTATTACGGCTAT 


I-TevI s 


Bacteriophage 
T4 


5 ' - AGTGGT ATCAAC A GCTCAGT AGATG 


I-Tevll 


Bacteriophage 
T4 


5 ' -GCTTATGAGTATGAAGTGAACACGT * TATTC 
3 ' -CGAAT ACTCATACTTCACTTGTG * CAATAAG 


F-TevI 


Bacteriophage 
T4 


5 ' -^AAACACAAGA'AATGTTTAGTAAANfl^^ 
3 ' -CTTTGTGTTCTTTACAAATCAT 


F-TevII 


Bacteriophage 
T4 


5 ' -TTTAATCCTCGCTTC * AGATATGGCAACTG 
3 ' -AAATTAGGAGCGA^AGTCTATACCGTTGAC 



20 

Dabei sind auch Abweichungen (Degenerationen) der Erkennungs- 
sequenz umfasst, die dennoch eine Erkennung und Spaltung durch 
das jeweilige DSBI-Enzym ermSglichen. Derartige Abweichungen 
- auch in Zusammenhang mit unterschiedlichen Rahmenbedingungen 

25 wie beispielsweise Calcium oder Magnesium-Konzentration - sind 
beschrieben (Argast GM et al. (1998) J Mol Biol 280: 345-353), 
Ferner sind Kernsequenzen ("Core'-Sequenzen) dieser Erkennungs- 
sequenzen umfasst. Es ist bekannt, dass auch die inneren Anteile 
der Erkennungssequenz en fur einen induzierten Doppelstrangbruch 

30 genugen und dass die aufieren nicht unbedingt relevant sind, 
jedoch die Effizienz der Spaltung mitbestiramen k6nnen. So kann 
beispielsweise fur I-Scel eine lSbp-'Core'-Sequenz definiert 
werden. Der Begriff der DSB-Erkennungssequenz umfasst insofern 
auch alle wesentlichen gleichen Erkennungssequenzen. Im wesent- 

35 lichen gleiche Erkennungssequenzen meint solche Erkennungs- 
sequenzen, die zwar Abweichungen von der fur das jeweilige Enzym 
als optimal gefundenen Erkennungssequenz aufweisen, jedoch eine 
Spaltung durch dasselbe noch erlauben. 

40 Es sind verschiedene Orte der Lokalisation (bei bereits vor- 
handenen endogenen DSB-Erkennunsgsequenzen) bzw. Integration 
(bei kttnstlich generierten DSB-Erkennungssequenzen) fur die 
DSB-Erkennungssequenz mdglich. Beispielhaft seien zu nennen: 



45 
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a) Lokalisation (Integration) in einer transkriptionell stillen 
Region 

Lokalisation (Integration) der DSB-Erkennungssequenz in einer 
5 transkriptionell stillen Region des Plastidengenoms (inter- 

genische Region) ist die bevorzugte Ausftihrungsf orm. Eine 
Stdrung der plastidSren Funktionen kann so weitgehend aus- 
geschlossen werden. Hierbei ist zu beachten, dass fiir eine 
Expression gegebenenfalls entsprechende regulatorische 
10 Elemente wie Promotoren etc. mit eingebracht werden miissen. 

b) Lokalisation (Integration) in eine transkriptionell aktive, 
aber nicht-kodierende (intercistronische) Region 

15 Diese Lokalisation (Integration) hat den Vorteil, dass da- 
durch die einzubringende Insertionssequenz letztendlich in 
einem plastidaren Operon kodiert ist und Promotor (en) bzw. 
Terminator (en) nicht gesondert mit eingebracht werden mttssen, 
sondern die endogen an diesem Locus vorhandenen ausgenutzt 

20 werden konnen (aber nicht miissen) . Es soil ten in einem 

solchen Fall lediglich Ribosomenbindestellen in geeignetem 
Abstand stromaufwarts der kodierenden Region der einzu- 
bringenden Fremd-Gene vorhanden sein. 

25 Es ist jedoch auch denkbar, dass eine intergenische Region 

nicht vollst&ndig transkriptionell still ist, weil beispiels- 
weise eine nur inef fiziente Termination der Transkription von 
einem benachbarten Gen oder Operon erfolgt. 

30 c) Lokalisation (Integration) in eine transkriptionell aktive, 
kodierende Regionen. 

Die unter a) und b) beschriebene Lokalisation (Integration) 
der DSB-Erkennungssequenz an einem nicht kodierenden Locus, 

35 hat den Vorteil, dass die Insertion der Fremd-DNA die Funk- 

tion des Plastidengenoms mit hoher Wahrscheinlichkeit nicht 
beeinflusst. Nicht-kodierende Bereiche sind jedoch weniger 
konserviert als kodierende. Um ein moglichst universelles 
Verfahren zu haben, dass in vielen Pf lanzenarten funktio- 

40 niert, ist in einer besonders bevorzugten Ausftthrungsform, 

die DSB-Erkennungssequenz (und infolge die Insertionssequenz) 
in der kodierende Sequenz eines bestehenden Gens lokalisiert. 
Die Zerstdrung der Genfunktion durch die EinfUhrung der 
DSB-Erkennungssequenz (bei einer kOnstlich generierten DSB- 

45 Erkennungssequenz) oder die Einflihrung der Insertionssequenz 

wird auf erf inderische Weise dadurch verhindert, dass die 
DSB-Erkennungssequenz bzw. die Insertionssequenz in einer 
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bevorzugten Variante dieser Ausftihrungsf orm im Rahmen eines 
Introns eingebracht wird. Auf diese Weise wird die voll- 
standige, kodierende mRNA durch SpleiSen der pre-RNA des 
Gens am Integrationsort wieder generiert. 

5 

Nicht naturlicherweise in der plastidSren DNA vorkommende 
DSB-Erkennungssequenzen konnen auf verschiedene Arten in die 
plastidSre DNA eingeftihrt werden. Beispielhaft seien zu nennen: 

10 a) Integration mitt els Doppel-Crossover 

Bevorzugt wird die Integration in das Plastidengenom 
mit Hilfe der oben beschriebenen, dem Fachmann allgemein 
bekannten Verfahren (Doppel-Crossover) durchgef tihrt . 

15 

b) Integration unter Verwendung natttrlicher, endogener DSB- 
Erkennungssequenzen 

c) Integration unter Verwendung von Rekombinasen und entspre- 
20 chenden Erkennungssequenzen. 

Auch wenn der Auf wand zur Insertion einer kilns t lichen DSB- 
Erkennungssequenz in die plastidare DNA relativ hoch ist und im 
Fall von a) dem der zur Zeit im Stand der Technik beschriebenen 

25 Verfahren zur Plastidentransformation entspricht, so muss dieser 
Auf wand lediglich einmalig betrieben werden. Die erhaltene homo- 
transplastome Masterpf lanze kann dann fiir beliebig viele unter- 
schiedliche nachfolgende Transformationen unter Verwendung des 
erfindungsgem&lSen Verfahrens eingesetzt werden, was eine erheb- 

30 liche Steigerung der Trans forma tionsef f izienz ermdglicht; Statt 
den herkSmmlichen Selektionsprozess fiir eine homotransplastome 
Pf lanze jedes Mai vollstandig durchlaufen zu mussen, muss er 
hier nur einmal realisiert werden. 

35 "Deaktivierung der FunktionalitSt" einer DSB-Erkennungssequenz 
meint, dass durch Insertion der Insertionsseguenz an oder nahe 
der Position des Doppelstrangbruches eine ZerstSrung der DSB- 
Erkennungssequenz erfolgt, d.h., dass das entsprechende DSBI- 
Enzym die Region nicht mehr erkennt und dementsprechend dort 

40 keinen Doppelstrangbruch mehr induziert. 

Aufbau des Transf ormationskonstruktes mit der Insertionssequenz 

Unter Verwendung einer der oben beschriebenen Masterpf lanzen bzw. 
45 von diesen abgeleiteten Zellen, die eine natxirliche und/ oder eine 
kunstlich-erzeugte DSB-Erkennungssequenz im Plastom en thai ten, 
wird die Insertionssequenz in besagte DSB-Erkennungssequenz 
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im Rahmen einer Transformation insertiert. Dies geschieht bei 
gleichzeitigem Vorhandensein eines DSBI-Enzyms, welches eine 
der DSB-Erkennungssequenzen im Plastom erkennt. 

5 In seiner einfachsten Form besteht das Transf ormationskonstrukt 
allein aus der Insertionsseguenz selber, beispielsweise aus 
einer Expressionskassette, die die Expression eines bestiramten 
Gens in den Plastiden gewahrleisten soil. Die sequenzspezif ische 
Induktion von Doppelstrangbrttchen ist ausreichend, um die 
10 Platzierung dieser Insertionssequenz an dieser Position zu 

gewahrleisten und so die Deaktivierung der DSB-Erkennungssequenz 
zu bewirken. 

In einer bevorzugten Aus ftihrungs form umfasst die Insertionsse- 
15 quenz mindestens eine zu exprimierende Nukleinsauresequenz. Um 
die Expression (Transkription und/oder Translation) zu gewahr- 
leisten, sind diese - je nach Aus fuhrungs form und Insert ionsort - 
mit regulatorischen Elementen zu versehen. Erfolgt die Insertion 
in einen transkriptionell aktiven Lokus so sind - wie oben be- 
20 schrieben - keine Promotorseguenzen erf orderlich. Vorteilhaft 
werden die zu exprimierenden Sequenzen in jedem Fall mit Ribo- 
somenbindestellen in geeignetem Abstand stromauf warts des offenen 
Leserahmens versehen oder besitzen bereits solche von Natur aus. 
Diese regulatorischen Sequenzen oder Teile derselben k6nnen aber 
25 auch im Plastom naturlicherweise vorhanden sein oder bereits im 
erst en Schritt, d.h. bei der Generierung einer nicht -natur lichen 
Masterpf lanze zusammen mit der der DSB-Erkennungssequenz in die 
plastidare-DNA eingefuhrt werden. 

30 Eine Steigerung der Insertionsef fizienz und -genauigkeit kann 
dadurch bewirkt werden, dass die im Transf ormationskonstrukt 
enthaltene Insertionssequenz und die DSB-Erkennungssequenz von 
homologen Sequenzbereichen flankiert werden, die eine homologe 
Rekombination infolge des induzierten Doppelstrangbruches 

35 gewahrleisten. In einer bevorzugten Ausfuhrungsf orm umfasst die 
Insertionssequenz f lankierende Homologiesequenzen A' bzw. B' , 
wobei die in die plastidare DNA einzufugende Sequenz zwischen 
A' und B' liegt. Die DSB-Erkennungssequenz wird von Homologie- 
sequenzen A bzw. B flankiert, wobei die DSB-Erkennungssequenz 

40 zwischen A und B liegt. A und B kQnnen naturlichen Ursprungs 
sein, oder im Rahmen der Insertion von nicht -natur lichen DSB- 
Erkennungssequenzen eingefuhrt worden sein. A und A' bzw. B und 
B' weisen eine ausreichende Lange und ausreichende Homologie zu 
einander auf , um eine homologe Rekombination zwischen A und A' 

45 bzw. B und B' zu gewahrleisten. 
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In einer weiteren Ausfuhrungsform ist die DSB-Erkennungssequenz 
lediglich von einer Homologiesequenz A flankiert, die eine aus- 
reichende Homologie zu einer die Insertionssequenz einseitig 
flankierenden Sequenz A' aufweist. 

5 

"Ausreichende Lange" meint in Bezug auf die Homologiesequenzen 
bevorzugt Sequenzen von einer Lange von mindestens 20 Basen- 
paaren, bevorzugt mindestens 50 Basenpaaren, besonders bevorzugt 
von mindestens 100 Basenpaaren, ganz besonders bevorzugt von 
10 mindestens 250 Basenpaaren, am meistens bevorzugt von mindestens 
500 Basenpaaren. 

"Ausreichende Homologie" meint in Bezug auf die Homologie- 
sequenzen A und A' bzw. B und B' bevorzugt Sequenzen die eine 

15 Homologie innerhalb dieser Homologiesequenzen aufweisen von 
mindestens 70 %, bevorzugt 80 %, vorzugsweise mindestens 90 %, 
besonders bevorzugt mindestens 95 %, ganz besonders bevorzugt 
mindestens 99 %, am meisten bevorzugt 100% ttber eine Lange von 
mindestens 20 Basenpaaren, bevorzugt mindestens 50 Basenpaaren, 

20 besonders bevorzugt von mindestens 100 Basenpaaren, ganz beson- 
ders bevorzugt von mindestens 250 Basenpaaren, am meistens bevor- 
zugt von mindestens 500 Basenpaaren. 

Unter Homologie zwischen zwei Nukleinsauren wird die Identit&t 
25 der NukleinsMuresequenz uber die jeweils gesamte Sequenzl&nge 

verstanden, die durch Vergleich mit Hilfe des Programmalgorithmus 
GAP (Wisconsin Package Version 10.0, University of Wisconsin, 
Genetics Computer Group (GCG) , Madison, USA) unter Einstellung 
folgender Parameter berechnet wird: 

30 

Gap Weight: 12 Length Weight: 4 

Average Match: 2,912 Average Mismatch: -2 , 003 

35 Da die homologe Rekombination durch den induzierten Doppelstrang- 
bruch gef order t wird, sind die Anforderungen an Lange und Homo- 
logie der Sequenzen deutlich geringer als beispielsweise bei 
einer konventionellen homologen Rekombination. Die homologen 
Bereiche k6nnen dabei auch deutlich kleiner als 250 bp sein. Die 

40 Verwendung von Homologiesequenzen, hat den Vorteil, dass wenn A' 
und B' unterschiedlich sind, oder lediglich eine Homologiesequenz 
A' verwendet wird, eine gerichtete Insertion der Insertions- 
sequenz in die plastidSre DNA erfolgen kann. 

45 Bevorzugt umfasst das Trans format ionskonstrukt oder die 

Insertionssequenz einen Selektionsmarker, der eine Selektion 
transplastomer Plastiden ermSglicht (s.u.), besonders bevorzugt 
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aadA, BADH oder einen "binding type "-Marker. Der Selektionsmarker 
ist bevorzugt so konstruiert, dass eine nachfolgende Deletion aus 
dem Plastom ennSglicht wird. Entsprechende Verfahren sind dem 
Fachmann bekannt und unten beschrieben. 

5 

Die Insertionssequenz oder das Transformationskonstrukt hat 
bevorzugt die Struktur und Sequenz eines Introns. In der Regel 
werden dazu nattirlicherweise vorkommende Introns so modifiziert, 
dass sie den Erfordernissen des erfindungsgemafien Verfahrens 

10 gentigen. Derartige artifizielle Introns sind insbesondere bevor- 
zugt, wenn die Insertion in eine transkriptionell aktive oder 
gar kodierende Region - beispielsweise unter Nutzung einer nattlr- 
lichen, endogenen DSB-Erkennungs sequenz - erfolgen soil, Bevor- 
zugt erfolgt die Insertion derart, dass die insertierte Sequenz 

15 durch Spleifcen der pre-mRNA restlos entfemt wird. Die heraus- 
gespleiSte RNA (also das artifizielle Intron) stellt dann die 
mRNA beispielsweise ftir die Translation auf ihr kodierter 
Proteine dar. Dieses Verfahren hat weitere Vorteile: 

20 - Die genutzten Introns weisen eine ausgepragte Sekundarfaltung 
auf, so dass sich eine relativ stabile RNA ergibt. Dadurch 
k6nnen die in dem Intron kodierten Gene von Interesse 
besonders hoch exprimiert werden, wie es beispielsweise 
in E. coli demonstriert wurde (Chan KYW et al. (1988) Gene 

25 73:295-304) . 

Wenn das Intron in ein Gen hinein integriert wird, unter liegt 
die Transkription des Introns der regulatorischen Kontrolle 
des Gens, in das das Intron integriert wurde. Daher kann 

30 man sich alle regulatorischen Elemente stromaufw&rts bzw. 

stromabw&rts der Gene oder des Gens von Interesse in dem 
Intron sparen. Dadurch kann man die Konstrukte entsprechend 
klein halten und ist sicher, dass eine Transkription auch 
in der betrachteten Spezies tatsachlich f unktioniert . Die 

35 Nutzung heterologer regulatorischer Elemente beinhaltet ein 

Restrisiko, dass diese nicht in den betrachteten Plastiden 
der entsprechenden Pflanzenart funktionell sind. Die Nutzung 
homologer Sequenzen kann aufgrund der Sequenzduplikation 
zu spontanen Rekombiationsereignissen mit den endogenen 

40 Sequenzen und so zu einer Instabilit&t des Organellgenoms 

fiihren. Durch die M6glichkeit auf das Einbringen regu- 
latorischer Elemente weitgehend verzichten zu k6nnen - bei- 
spielsweise indem man das Gen von Interesse in einem Intron 
kodiert, welches in eine transkriptionell aktive Region 

45 des Plastoms insertiert wird, kdnnen mit dem erfindungs- 

geraaSen Verfahxen in dieser Aus ftihrungs form zusfitzlich zur 
Steigemng der Insertions- und Verbreitungsfahigkeit des 
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Transformationskonstruktes viele weitere Nachteile der 
konventionellen Plastidentransformation umgangen werden. 

Daruber hinaus sind alle Introns nutzbar, wenn man gleichzeitig 
5 die entsprechenden Faktoren, die das Spleifien vermitteln, in 
den Plastiden exprimiert oder sie in diese importiert, Bevorzugt 
sind die das SpleiSen unterstutzenden Faktoren im Intron selbst 
kodiert. Besonders bevorzugt werden in dieser Ausfiihrungsf orm 
Introns der Gruppe II, die selbst wenigstens einen der ftlr das 

10 Spleifcen notwendigen Faktoren kodieren. Dazu geh6rt das Ll.ltrB 
Intron aus Lactococcus. Ebenfalls bevorzugt sind Introns, die 
nattirlicherweise in Plastiden hSherer Pflanzen vorkommen, 
besonders Introns der Gruppe II, ganz besonders bevorzugt 
Introns, die ftir ein Protein kodieren, am meisten bevorzugt 

15 Introns der trnK Gene des Plastidengenoms. Im letzteren Fall 
sind besonders bevorzugt die Introns aus den trnK Genen der 
Plastiden aus den Arten Arabidopsis, Mais und Tabak. 

Bevorzugt sind Introns mit einer selbst-spleifcenden Aktivit&t, 
20 die nicht von weiteren Proteinfaktoren abh&ngt, oder Introns, die 
allgemeine Faktoren zum Spleissen benutzen, die universell und 
daitiit auch in Plastiden vorhanden sind, sowie Introns, die selbst 
fur Faktoren kodieren, die fiir das Spleifcen notwendig sind. . Zu 
diesen Introns gehoren beispielsweise 

25 

a) das Intron der Gruppe I aus Tetahymena (GenBank Acc.-No.: 
X54512; Kruger K et al. (1982) Cell 31:147-157; Roman J 
und Woodson SA (1998) Proc Natl Acad Sci USA 95:2134-2139) 

30 b) das rll-Intron der Gruppe II aus Scenedesmus obliquus (Gen- 
Bank Acc.-No.: X17375.2 Nukleotide 28831 bis 29438; Hollander 
V und Kuck U (1999) Nucl Acids Res 27: 2339-2344; Herden- 
berger F et al. (1994) Nucl Acids Res 22: 2869-2875; Kuck U 
et al. (1990) Nucl Acids Res 18:2691-2697). 

35 

c) das Ll.LtrB Intron (GenBank Acc.-No.: U50902 Nukleotide 2854 
bis 5345) 

d) das trnK- Intron aus Arabidopsis (GenBank Acc.-No.: AP000423 
40 Neukleotide komplement&r 1752 bis 4310) 

e) das trnK-Intron aus Mais (GenBank Acc.-No.: X86563 Nukleotide 
komplementar 1421 bis 3909) 

45 f) das trnK-Intron aus Tabak (GenBank Acc.-No.: Z00044 Nukleo- 
tide komplement&r 1752 bis 4310) 
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Sowohl artfremde als auch natiirlicherweise in den Plastiden der 
jeweiligen Pflan2e vorkommende Introns k6nnen genutzt werden. Zur 
Vermeidung von durch Sequenzduplikation bedingte Instabilitaten 
sind artfremde Introns - beispielsweise artfremde trnK-Introns - 
5 bevorzugt. Natiirlicherweise in den Plastiden der jeweiligen 
Pflanze vorkommende Introns werden in einer bevorzugten Aus- 
ftihrungsf orm so modifiziert, dass sie zwar ihre Funktion noch 
erfullen kdnnen, die Sequenzhomologie jedoch geringer als 95 %, 
bevorzugt 80 %, besonders bevorzugt 70 % zu der Sequenz des Aus- 
10 gangsintrons ist. 

In einer weiteren bevorzugten Ausftthrungsf orm steht ein Faktor, 
welcher das Spleifcen des betrachteten Intron bewirkt, in trans 
zur Verfugung, d.h. ist nicht in dem Intron selbst kodiert. 1st 

15 dieser Faktor nicht nattirlicherweise in dem betrachteten Plastid 
vorhanden, sondern wird erst in dieses eingebracht, kann dies 
auf verschiedene dem Fachmann bekannte Arten erfolgen. Beispiels- 
weise sei das Einbringen einer entsprechenden kodierenden und 
exprimierbaren Sequenz in das Plastom oder das Einbringen in die 

20 nukle&re DNA genannt, wobei in letzterem Fall der Faktor vorzugs- 
weise an eine PLS fusioniert wird. 

Besonders bevorzugt sind Introns, die natiirlicherweise ein DSB- 
Enzym ( insbesondere eine Homing Endonuklease kodieren) . Besonders 
25 bevorzugt ist das Intron Cp.LSU2 aus Chlamydomonas pallidostig- 
matica, welches das Enzym I-Cpal codiert (Turmel M et al. (1995) 
Mol Biol Evol 12:533-545). Bevorzugt sind ferner die Introns der 
Gruppe II aus den Mitochondrien der Hefe. 

30 In einer bevorzugten Aus ftihrungs form wird die Intronsequenz dem 
Insertionsort angepasst, so dass sie an diesem Lokus spleifien 
kdnnen. Die Anpassung kann bei Gruppe I Introns die interna! 
guide sequence (IGS) bzw. bei den Introns der Gruppe II die exon 
binding sequence (EBS) I oder/und II betreffen. 

35 

Im Fall des trnK Introns aus Mais ist zu beachten, dass das vom 
trnK Intron kodierte Protein, welches auch die Maturasefunktion 
umfasst, in seiner naturlich kodierten Form vermutlich nicht ohne 
Editierung funktionell ist. Es konnte gezeigt werden, dass eine 

40 Editierung (His420Tyr) der entsprechenden mRNA in Plastiden der 
Gerste erfolgt (Vogel J et al. (1997) J Mol Biol 270:179-187). 
Tyrosin an Position 420 des matK Proteins ist hoch konserviert. 
Auch bei den Monokotyledonen Reis und Mais wurde in der kodieren- 
den DNA an entsprechender Position ein Kodon kodierend fur His 

45 gefunden. Es ist daher davon auszugehen, dass - wie in Gerste - 
auch in diesen Pflanzen das matK Transkript editiert wird. Da 
jedoch gegebenenfalls andere Pf lanzenarten diese Editierung der 
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RNA nicht gewShrleisten kSnnen, wird in einer bevorzugten Aus- 
fuhrungsf orm das matK Gen im trnK-Intron aus Mais bereits durch 
einen entsprechenden His/Tyr-Austausch auf DNA-Ebene roodifiziert, 
so dass eine RNA-Editierung nicht mehr erforderlich ist. Bei- 
5 spielsweise kann die Sequenz CATTATCATAGTGGAT des Mais trnK 
Intron mutiert werden zu CATTATTATAGTGGAT . 

Die Spleifcstelle wird im Fall von Gruppe I Introns bestiitimt durch 
die Paarung der IGS mit dem 5' und/oder 3' zum Intron gelegenen 

10 Exon des entsprechenden Transkriptes (Lambowitz AM & Belfort M 
(1993) Annu Rev Biochem 62:587-622) . Durch dem Fachmann bekannte 
Techniken wie PCR oder synthetisches Erstellen von Nukleotid- 
sequenzen k6nnen die IGS beliebiger Gruppe I Introns entsprechend 
so angepasst werden, dass ein SpleiSen an der vordef inierten 

15 Insertionsstelle innerhalb der DSB-Erkennungsregion erfolgt. Die 
verSnderte IGS wird derart gestaltet, dass sie - zumindest teil- 
weise - Basenpaarung mit den Sequenzen des Transkriptes 5' und 3' 
der Insertionsstelle eingehen kann. Bevorzugt wird das Intron 
CpLSU2 aus C. pallidostigmatica genutzt, welches ftir die Homing 

20 Endonuklease I-Cpal codiert. Wird dieses in Zusammenhang mit 
der Expression des DSBI-Enzyme I-Cpal genutzt, wodurch es zu 
einer Insertion der zu trans formierenden DNA in die 23SrDNA des 
Plastidengenoms hSherer Pflanzen kommt, ist keine Anpassung des 
Introns notwendig. Die Insertion erfolgt an einen Lokus im Pla- 

25 stidengenom hdherer Pflanzen, der homolog zu dem ist, an dem sich 
das Intron nattirlicherweise in C. pallidostigamtica befindet. 
Dieses Introns ist daher bereits derart gestaltet, dass Paarungen 
mit dem. 5' und 3' Exon eingegangen werden kdnnen und korrektes 
Spleifcen in dieser Nukleotidumgebung erfolgt. Bevorzugt wird 

30 ferner das Gruppe I Intron aus Tetrahymena thermophila. Dort 
unterbricht es als 413bp lange n Intervening Sequence" (IVS) die 
26S rRNA codierende Region (Accession V01416 J01235 Nukleotide 
53 bis 465) . Die nattirlicherweise zu findende IGS mit der Sequenz 
5'-ggaggg-3' (Waring RB et al. 1985 Cell 40: 371-380; Been, MD & 

35 Cech, TR 1986 Cell 47: 207-216) kann durch den Fachmann bekannte 
Techniken an die neue Insertionsstelle angepasst werden. Wird 
beispielsweise eine Integration in die DSB-Erkennungsstelle 
des I-Cpal Enzyms an die mit A gekennzeichnete Stelle gewOnscht 
(cggtcct^aaggtagcgaaattc) , kann die rautierte, angepasste IGS 

40 beispielsweise folgende Sequenz besitzen: 5 ' -gggacc-3 9 . 

Bei Gruppe II Introns, die mobil sind, sind neben der Maturase 
hauf ig weitere AktivitSten in dem Proteinanteil des Ribonukleo- 
protein-Komplexes kodiert. Diese sind fur das beschriebene 
45 Verfahren jedoch nicht zwangslcluf ig notwendig und kdnnen daher 
deletiert werden. Sie werden sogar bevorzugt deletiert, da da- 
durch das entsprechende Konstrukt kleiner und leichter handhabbar 
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ist. Dem Fachmann sind verschiedene Moglichkeiten bekannt, wie 
die entsprechenden Aktivit&ten aus dem Proteinanteil entfernt 
werden k6nnen* Dies kann zum Beispiel durch Erstellen eines 
synthetischen Gens, welches nur noch die gewiinschten Bereiche 
5 umfasst, oder durch geeignete PCR Methoden erfolgen. 

Selbst-spleifcende Introns der Gruppe II besitzen eine konser- 
vierte Struktur und bestehen im allgemeinen aus 6 verschiedenen 
DomSnen. DomSne I beinhaltet die Exon-Bindestellen (EBS1 und 

10 EBS2) , die beim SpleiEvorgang eine Interaktion mit dem 5' vom 

Intron gelegenen Exon eingehen. Dariiber hinaus findet eine Inter- 
aktion zwischen der *8 Region" (unmittelbar 5' der EBS1 gelegen) 
und der "8' Region" am 3' Exon statt (Lambowitz AM & Belfort M 
(1993) Annu Rev Biochem 62:587-622; Michel F & Ferat JL (1995) 

15 Annu Rev Biochem 64:435-461) • Diese Sequenzen k6nnen durch dem 
Fachmann bekannte Techniken wie synthetisches Erstellen der 
Introns oder geeignete PCR Methoden jeweils derart angepasst 
werden, dass eine korrekte Wahl der SpleiEstellen an dem in der 
DSB-Erkennungsregion gewahlten Insertionsort gewahrleistet ist, 

20 Dies geschieht, indem man die genannten Regionen so modifiziert, 
dass Basenpaarungen mit den entsprechenden Sequenzen stromauf- 
wSrts (intron binding sequences, IBS) und stromabwSrts (8') der 
kttnstlichen Insertionssequenz eingegangen werden konnen. wahlt 
man als Insertionsort ( A ) fiir das Ll.LtrB Intron in der I-Cpal 

25 Erkennungsregion beispielsweise cggtcctaaggf'agcgaaattc, so kann 
die 8 und EBS1 Region beispielsweise die Sequenz TCGCTACCTTAG 
(naturliche Sequenz: TTATGGTTGTG) , die EBS2 beispielsweise die 
Sequenz GACCG (naturliche Sequenz: ATGTG) annehmen. WShlt man 
das trnK Intron aus Arabidopsis thaliana, so kann die 8 und EBS1 

30 Region bei Annahme der gleichen Insertionsstelle wie fur das 

Ll.LtrB Intron angegeben beispielsweise die Sequenz CGCTACCTTAGG 
(naturliche Sequenz: AATGTTAAAAA) annehmen. 

Wenn es sich bei der DSB-Erkennungs sequenz urn eine naturliche, 
35 endogene Erkennungs sequenz einer Homing Endonuklease handelt, 
erfolgt die Insertion eines gewahlten Introns bevorzugt an der 
Stelle der DSB-Erkennungsregion, an der auch nattirlicherweise das 
Intron zugeh5rig zur betrachteten Homing Endonuklease zu finden 
ist. 

40 

Bevorzugt wird die ktinstliche Insertionsstelle eines Introns in 
der DSB-Erkennungsstelle derart ausgewShlt, dass 5' und 3' des 
insertierten Intron mSglichst viele Basen denen an der natiir- 
lichen Insertionsstelle des betrachteten Introns entsprechen 
45 und die DSB-Erkennungs sequenz nach der Insertion des Introns 
nicht mehr funktionell ist. Ganz besonders bevorzugt entspricht 
das jeweils unmittelbar stromauf warts bzw. stromabw&rts der 
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Insertionsstelle des Intron gelegene Nukleotid dem am natiirlichen 
Insertionsort . 

In einer besonders bevorzugten Ausfxihrungsform ist das Intron 
5 von Homologiesequenzen flankiert, um eine gerichtete Insertion 
zu erm6glichen. Die Homologiesequenzen sind dabei - wie oben 
beschrieben - homolog zu den die DSB-Erkennungssequenz f lan- 
kierenden Sequenzen und ermdglichen so eine exakte Insertion. 

10 Ein weiterer Gegenstand der Erfindung betrif ft daher DNA-Kon- 
strukte umfassend mindestens eine NukleinsSuresequenz sowie In- 
tronsequenzelemente, die bef&higt sind, in einer von besagtem 
DNA-Konstrukt abgeleiteten Ribonukleinsauresequenz die Deletion 
des ftir besagte NukleinsSuresequenz kodierenden RibonukleinsSu- 

15 refragmentes zu gew^hrleisten, wobei besagte die Nukleinsaurese- 
quenz in Bezug auf besagte Intronsequenzelemente heterolog ist. 

In einer bevorzugten Ausftihrungsform ist die NukleinsSuresequenz 
zumindesten von einer Spleifcakzeptorsequenz und einer Splei&do- 
20 norsequenz flankiert. 

In einer weiteren Ausftthrungsform umfasst das DNA-Konstrukt am 
5'- und 3'-Ende Sequenzen HI bzw. H2, die eine ausreichende Lange 
und Homologie zu plastidSren Sequenzen HI' bzw. H2' aufweisen, um 
25 eine homologe Rekombination zwischen Hi und Hi' bzw. H2 und H2' 
und damit eine Insertion der von Hi und H2 f lankierten Sequenz in 
das Plastom zu gewShrleisten. 

Ein weiterer Gegenstand der Erfindung betrif ft eine transgene 
30 Plastiden-DNA umfassend mindestens eine NukleinsSuresequenz sowie 
Intronsequenzelemente, die befShigt sind, in einer von besagter 
transgenen Plastiden-DNA abgeleiteten Ribonukleinsauresequenz die 
Deletion des fur besagte Nukleinsauresequenz kodierenden Ribonu- 
kleinsSurefragmentes zu gewShrleisten, wobei die besagte Nuklein- 
35 s&uresequenz in Bezug auf besagte Intronsequenzelemente heterolog 
ist. In einer bevorzugten Ausfuhrungsf orm ist die Nukleinsaurese- 
quenz zumindesten von einer Spleifcakzeptorsequenz und einer 
Spleifidonorsequenz flankiert. 

40 Die Insertionssequenz oder das Transformationskonstrukt kann 
zum Aufbau eines Trans formationsvekt or in einen Standard- 
Vektor wie pBluescript oder pUC18 kloniert werden. In einer 
bevorzugten Ausfuhrungsform wird die Insertionssequenz bzw. 
Transformationskonstrukt als lineares oder linearisiertes 

45 DNA-Mol ektil appliziert. 
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Bevorzugt wird nur der Teil des Trans format ionsvekt or s appli- 
ziert, der die Insertionssequenz oder das Transformations- 
konstrukt mit ggf . Homologiesequenzen, Selektionsmarker 
und/oder die Expressionskassette far das DSBI-Enzym umfasst. 
5 Wird ganz oder teilweise auf Homologiesequenzen verzichtet, so 
wird das linearisierte DNA Molekul bevorzugt durch Verdau mit 
Restriktionsendonukleasen erhalten, die an einem oder beiden 
Enden einzelstrSngige DNA-Oberhange generieren, die zu denen 
kompatibel sind, die das DSBI-Enzym in der plastidSren DNA 
10 erzeugt. 

Der Trans format ionsvekt or kann in einer bevorzugten AusfOhrungs- 
form Elemente (z.B. einen plastid&ren ORI origin of replication, 
Replikationsursprung) umfassen, die es ihm ermSglichen, vor 

15 der Integration in die plastid&re DNA im Plastid autonom zu 

replizieren oder stabil als extrachromosomales DNA-Mo 1 eku 1 in den 
Plastiden zu existieren. Entsprechende Verfahren sind dem Fach- 
mann bekannt (US 5,693,507; US 5,932,479; WO 99/10513). Dieses 
Verfahren ist bevorzugt, da es die zur Integration im Plastid zur 

20 Verfugung stehende Kopienzahl der Insertionssequenzen steigert. 

Eines der oben beschriebenen Konstrukte kann mit einem der 
beschriebenen Verfahren in die Plastiden einer entsprechenden 
Masterpflanze eingebracht werden. Bevorzugt sind Mikroinjektion 
25 und besonders bevorzugt Partikelbeschuss . 

Klonierungs-, Expressions-^, Selektions- und Transf ormations- 
verfahren 



30 "Expressionskassette" meint - zum Beispiel in Bezug auf die 
Expressionkassette fur das DSBI-Enzym - solche Konstruktionen 
bei denen die zu exprimierende DNA in funktioneller Verknupfung 
mit mindestens einem genetischen Kontrollelement steht, dass ihre 
Expression (d.h. Transkription und oder Translation) ermdglicht 

35 oder reguliert. Dabei kann die Expression zum Beispiel stabil 
oder transient, konstitutiv oder induzierbar erfolgen. FiXr die 
Einfuhrung stehen dem Fachmann verschiedene unten aufgef^hrte 
direkte (z.B. Transf ektion, Partikelbeschuss, Mikroinjektion) 
oder indirekte Verfahren (z.B. Agrobakterieninf ektion, Virus- 

40 infektion) zur Verftigung, die weiter \inten aufgefiihrt werden. 

Unter einer funktionellen Verkniipfung versteht man allgemein eine 
Anordnung in der eine genetische Kontrollsequenz ihre Funktion in 
Bezug auf eine NukleinsSuresequenz - beispielsweise kodierend far 
45 ein DSBI-Enzym - aus\lben kann. Funktion kann dabei beispielsweise 
die Kontrolle der Expression d.h. Transkription und/oder Trans- 
lation der NukleinsSuresequenz - beispielsweise kodierend far 



WO 03/054189 



PCT/EP02/14302 



49 

ein DSBI-Enzym - bedeuten. Kontrolle umfasst dabei beispiels- 
weise die Initiierung, Steigerung, Steuerung oder Suppression der 
Expression d.h. Transkription und ggf . Translation. Die Steuerung 
wiederum kann beispielsweise gewebe- und oder zeitspezif isch 
5 erfolgen. Sie kann auch induzierbar zum Beispiel durch bestimmte 
Chemikalien, Stress, Pathogene etc. sein. 

Unter einer funktionellen Verkntipfung versteht man zum Beispiel 
die sequentielle Anordnung eines Promoters, der zu exprimierenden 
10 Nukleins&uresequenz - beispielsweise kodierend fiir ein DSBI-Enzym 

- und ggf- weiterer regulativer Elemente wie zum Beispiel einem 
Terminator derart, dass jedes der regulativen Elemente seine 
Funktion bei der Expression der NukleinsSuresequenz - beispiels- 
weise kodierend fttr ein DSBI-Enzym - erfullen kann. Dabei ist 

15 es nicht zwingend notwendig, dass die funktionelle Verkmipfung 
bereits auf den Transf ormationskonstrukten gegeben ist. Die 
funktionelle Verkniipfung kann sich auch in Folge der Insertion in 
die Kern- bzw. plastid&re DNA ergeben, wobei hier die regulativen 
Elemente bereits in der Kern- bzw. plastidSLre DMA vorliegen. Die 

20 regulativen Elemente kdnnen diesbezuglich naturlicherweise vor- 
liegen oder aber in einem vorgeschalteten Schritt - beispiels- 
weise bei der Einfiihrung einer kOnstlichen DSB-Erkennungssequenz 

- eingebracht werden. 

25 Dazu ist nicht unbedingt eine direkte Verkntipfung im chemischen 
Sinne erf orderlich. Genetische Kontrollsequenzen, wie zum Bei- 
spiel Enhancer-Sequenzen, k5nnen ihre Funktion auch von weiter 
entfernten Positionen oder gar von anderen DNA-Mo 1 ektil en aus auf 
die Zielsequenz austtben. Bevorzugt sind Anordnungen, in denen die 

30 zu exprimierende NukleinsSuresequenz - beispielsweise kodierend 
ftlr ein DSBI-Enzym - hinter eine als Promoter fungierende Sequenz 
positioniert wird, so dass beide Sequenzen kovalent miteinander 
verbunden sind. Bevorzugt ist dabei der Abstand zwischen der 
Promo tors equenz und der NukleinseLuresequenz - beispielsweise 

35 kodierend f\ir ein DSBI-Enzym - geringer als 200 Basenpaare, 
besonders bevorzugt kleiner als 100 Basenpaare, ganz besonders 
bevorzugt kleiner als 50 Basenpaare. 

Dem Fachmann sind verschiedene Wege bekannt, urn zu einem 
40 der erfindungsgemaSen Transf ormationskonstrukte, diese umfassen- 
den Vektoren oder einer der Expressionskassetten zu gelangen. 
Die Herstellung kann mittels gangiger Rekombinations- und 
Klonierungstechniken realisiert werden, wie sie beispielsweise 
in Maniatis T, Fritsch EF und Sambrook J, Molecular Cloning: A 
45 Laboratory Manual, Cold Spring Harbor Laboratory, Cold 
Spring Harbor, NY (1989) sowie in Silhavy TJ, Berman ML 
und Enquist LW, Experiments with Gene Fusions, Cold Spring Harbor 
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Laboratory, Cold Spring Harbor, NY (1984) und in Ausubel FM 
et al., Current Protocols in Molecular Biology, Greene Publishing 
Assoc. and Wiley Interscience (1987) beschrieben sind. Bevorzugt 
ist die direkte Fusion einer als Promoter fungierenden Nuklein- 
5 sSuresequenz mit einer zu exprimierenden Nukleotidsequenz - bei- 
spielsweise kodierend fur ein DSBI-Enzym. 

Der Begriff der *genetischen Kontrollsequenzen" ist breit zu 
verstehen und meint all solche Sequenzen, die einen Einfluss 

10 auf das Zustandekoramen Oder die Funktion einer Expressions- 

kassette oder Trans formationsvektors haben. Genet ische Kontroll- 
sequenzen gewahrleisten die Transkription und gegebenenf alls 
Translation in Zellkern (bzw. Zytoplasma) oder Plastiden. Vor- 
zugsweise umfassen die erf indungsgemafien Expressionskassetten 

15 5 ' -stromaufwarts von der jeweiligen zu exprimierenden Nuklein- 
s&uresequenz einen Promotor und 3 '-stromabwarts eine Terminator - 
seguenz als zusStzliche genetische Kontrollsequenz , sowie 
gegebenenf alls weitere ubliche regulative Elemente, und zwar 
jeweils funktionell verknupft mit der zu exprimierenden Nuklein- 

20 sauresequenz . 

Genetische Kontrollsequenzen sind beispielsweise beschrieben bei 
"Goeddel; Gene Expression Technology: Methods in Enzymology 185, 
Academic Press, San Diego, CA (1990)" oder "Gruber and Crosby, 
25 in: Methods in Plant Molecular Biology and Biotechnolgy, CRC 
Press, Boca Raton, Florida, eds.:Glick and Thompson, Chapter 7, 
89-108" sowie den dort aufgewiesenen Zitaten. 

Beispiele fttr derartige Kontrollsequenzen sind Sequenzen, an 
30 die Induktoren oder Repressoren binden und so die Expression der 
NukleinsSure regulieren. Zusatzlich zu diesen neuen Kontroll- 
sequenzen oder ans telle dieser Sequenzen kann die nattirliche 
Regulation dieser Sequenzen vor den eigentlichen Strukturgenen 
noch vorhanden sein und gegebenenfalls genetisch verSndert worden 
35 sein, so dass die natttrliche Regulation ausgeschaltet und die 
Expression der Gene erhoht wurde. Die Expressionskassette kann 
aber auch einfacher aufgebaut sein, das heiSt, es werden keine 
zus&tzlichen Regulationssignale vor die vorstehend erwahnten Gene 
insertiert und der naturliche Promotor mit seiner Regulation wird 
40 nicht entfernt. Stattdessen wird die natvirliche Kontrollsequenz 
so mutiert, dass keine Regulation mehr erfolgt und die Gen- 
expression gesteigert wird. Diese veranderten Promotoren kdnnen 
auch allein vor die natttrlichen Gene zur Steigerung der Aktivitat 
gebracht werden. 
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Je nach nachstehend nSher beschriebenen Wirtsorganismus oder Aus- 
gangsorganismus , der durch Einbringen der Expressionskassetten 
oder Vektoren in einen genetisch ver&nderten oder transgenen 
Organismus tiberfuhrt wird, eignen sich verschiedene Kontroll- 
5 sequenzen. 

Zur nuklearen Expression (beispielsweise einer viralen/Bakterio- 
phagen RNA-Polymerase oder eines DSBI-Enzyms mit einem plasti- 
dSren Transitpeptid) sind grundsStzlich alle Promotoren geeignet, 
10 der die Expression von Genen, insbesondere Fremdgenen, in 
Pflanzen steuern konnen. 

Geeignet sind Promotoren, die eine konstitutive Expression in 
Pflanzen ermoglichen (Benfey et al.(1989) EMBO J. 8:2195-2202). 

15 Vorzugsweise verwendet man insbesondere einen pflanzlichen 

Promotor oder einen Promotor, der einem Pf lanzenvirus entstammt. 
Besonders bevorzugt ist der Promotor des 35S-Transkriptes des 
Blumenkohlmosaikvirus (Franck et al. (1980) Cell 21:285-294; 
Odell et al.(1985) Nature 313:810-812; Shewmaker et al. (1985) 

20 Virology 140:281-288; Gardner et al. 1986, Plant Mol. Biol. 6, 
221-228) oder den 19S CaMV Promotor (US 5,352,605 and 
WO 84/02913). Dieser Promotor enthalt bekanntlich unterschied- 
liche Erkennungssequenzen fur transkriptionale Effektoren, die 
in ihrer Gesamtheit zu einer weitgehend permanenten und konstitu- 

25 tiven Expression des eingefuhrten Gens fiihren (Benfey et al. 

(1989) EMBO J 8:2195-2202). Ein weiterer geeigneter konstitutiver 
Promotor ist der "Rubisco small subunit (SSU) "-Promotor 
(US 4,962,028). Ein weiteres Beispiel eines geeigneten Promotors 
ist der LeguminB- Promotor (GenBank Acc.-No.: X03677) . Weitere be- 

30 vorzugte konstitutive Promotoren sind zum Beispiel der Promotor 
der Nopalinsynthase aus Agrobakterium, der TR-Doppelpromotor , der 
OCS (Octopin Synthase) Promotor aus Agrobakterium, der Ubiquitin 
Promotor (Holtorf S et al. (1995) Plant Mol Biol 29:637-649), 
die Promotoren der vakuolSrer ATPase Untereinheiten, der FBPaseP 

35 Promotor (WO 98/18940) oder der Promotor eines prolinreichen 
Proteins aus Weizen (WO 91/13991). Weiterhin geeignete und 
im Rahmen dieser Erfindung bevorzugte konstitutive Promotoren 
sind der Super Promotor (Ni M et al. (1995) Plant J 7:661-676; 
US 5,955,646) sowie der Nitrilase-1 Promotor des nitl Gens aus 

40 Arabidopsis (GenBank Acc.-No.: Y07648.2, Nukleotide 2456 bis 
4340; Hillebrand H et al. (1998) Plant Mol Biol 36 (l):89-99; 
Hillebrand H et al. (1996) Gene 170 (2) : 197-200) . 

Bevorzugt sind induzierbare, besonders bevorzugt chemisch 
45 induzierbare Promotoren (Aoyama T und Chua NH (1997) Plant J 

11:605-612; Caddick MX et al. (1998) Nat. Biotechnol 16:177-180; 
Rewiew: Gatz (1997) Annu Rev Plant Physiol Plant Mol Biol 
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48:89-108), durch die die Expression zu einem bestimmten Zeit- 
punkt gesteuert werden kann. Beispielhaft seien zu nennen der 
PRP1 Promotor (Ward et al.(1993) Plant Mol Biol 22:361-366), 
ein durch Salicylsaure induzierbarer Promotor (WO 95/19443), ein 
5 durch Benzolsulfonamid- induzierbarer Promotor (EP-A-0388186) , 
ein durch Tetrazyklin-induzierbarer Promotor (Gatz et al. (1992) 
Plant J 2:397-404), ein durch Abscisinsaure-induzierbarer Promo- 
tor (EP-A 335 528), ein durch Ethanol induzierbarer Promotor 
(Salter MG et al. (1998) Plant J". 16:127-132), der schwermetall- 

10 induzierbarer Metallothionein I Promotor (Amini S et al. (1986) 
Mol Cell Biol 6:2305-2316), der steroid-induzierbarer MMTV LTR 
Promotor (Izant JG et al. (1985) Science 229:345-352) sowie 
ein durch Cyclohexanon- induzierbarer Promotor (WO 93/21334) . 
Besonders bevorzugt ist die induzierbare Expression eines PLS/ 

15 DSBI-Enzym-Fusionsproteins im Kern. Induzierbare Promotoren 

umfasst auch solche, die durch bestimmte Repressorproteine (z.B. 
tet, lac) reguliert werden k6nnen. Entsprechende Repressorpro- 
teine konnen in Fusion mit PLS in die Plastiden translokalisiert 
werden und dort die Expression bestimmter Gene unter Kontrolle 

20 entsprechender Promotoren regulieren. Der Repressor bindet in den 
Plastiden an eine ktinstliche ins Plastom eingefugte Repressor- 
bindestelle und kann so die Expression des stromabwarts gelegenen 
Gens unterdrlicken (vgl. W095/25787) . Dadurch kann beispielsweise 
die Expression eines plastidkodierten DSBI-Enzym im Bedarfsfall 

25 induziert oder sie bis auf den Moment, in dem die Expression 
gewiinscht ist, unterdruckt werden. 

Ferner sind Promotoren bevorzugt, die durch biotischen oder 
abiotischen Stress induziert werden wie beispielsweise der 

30 pathogen-induzierbare Promotor des PRPl-Gens (Ward et al., 

Plant Mol Biol 1993, 22: 361-366), der hitzeinduzierbare hsp70- 
Promotor oder der hsp80 -Promoter aus Tomate (US 5,187,267), 
der kSlteinduziebare alpha-Amylase Promoter aus der Kartoffel 
(WO 96/12814) oder der verwundungsinduzierte pinll-Promoter 

35 (EP-A 0 375 091) . 

In einer besonders bevorzugten Aus fiihrungs form wird vor allem 
die fur das DSBI-Enzym kodierende NukleinsSure unter Kontrolle 
eines induzierbaren Promotors exprimiert. Damit wird eine 
40 kontrollierte, steuerbare Expression erreicht und etwaige 

Probleme durch eine konstitutive Expression eines DSBI-Enzyms 
vermieden . 

Vorteilhafte Kontrollsequenzen fdr die erf indungsgem&Een 
45 Expressionskassetten oder Vektoren umfassen virale, bakteriophage 
oder bakterielle Promotoren wie cos-, tac-, trp-, tet-, phoA-, 
tat-, lpp-, lac-, laclq-, T7-, T5-, T3-, gal-, trc-, ara-, SP6-, 



WO 03/054189 



PCT/EP02/14302 



53 

X-PR- 0< a er i m Jt-PL-Promotor . Diese werden bevorzugt in Kombination 
mit der Expression der jeweils korrespondierenden RNA-Polymerase 
eingesetzt . 

5 Die Expression in Plastiden kann unter Verwendung plastidSrer 
Promotoren und/oder Transkriptionsregulationselemente reali- 
siert werden. Beispielhaft jedoch nicht einschrSnkend seien 
zu nennen der RNA-Polymerase Promotor (WO 97/06250) oder die in 
WO 00/07431, US 5,877,402, WO 97/06250, WO 98/5559,5 WO 99/46394, 

10 WO 01/42441 und WO 01/07590 beschriebenen Promotoren. Zu nennen 
sind das rpo B Promotorelement, das atpB Promotorelement , das 
clpP Promotorelement (siehe auch WO 99/46394) oder das 16S- 
rDNA Promotorelement. Dabei kann dem Promotor auch ein poly- 
cistronisches tt Operon* zugeordnet sein (EP-A 1 076 095; 

15 WO 00/20611) . Beschrieben sind auch Systeme bei denen eine 

nicht-pflanzliche (z.B. virale) RNA-Polymerase unter Verwendung 
plastidarer Transitpeptide in das Plastid importiert wird und 
dort spezifisch die Expression transgener Sequenzen induziert, 
die unter Kontrolle der Erkennungssequenzen der RNA-Polymerase 

20 stehen und zuvor in die plastidSre DNA insertiert wurden 
(WO 95/16783; US 5,925,806; US 5,575,198). 

Neben den genannten Promotoren w&ren weiter bevorzugt zu ver- 
wenden: 

25 

a) der PrbcL Promotor (SEQ ID NO: 44) 

b) der Prpsl6 Promotor (SEQ ID NO: 50) 

30 c) der Prml6 Promotor (SEQ ID NO: 46) 

In einer besonders bevorzugten Ausftihrungsf orm werden NEP 
Promotoren eingesetzt. Dies sind Promotoren, die in Plastiden 
funktionell sind und von der nuklear kodierten, plastidaren 
35 RNA-Polymerasen (NEP) erkannt werden. Bevorzugt sind: Prrn-62; 
Pycf 2-1577; PatpB-289; Prps2-152; Prpsl6-107; Pycfl-41; 
PatpI-207; PclpP-511; PclpP-173 und PaccD-129 (WO 97/06250; 
Hajdukiewicz PTJ et al (1997) EMBO J 16:4041-4048). 

40 Besonders bevorzugt sind: 

a) Der PaccD-129 Promotor des accD Gens aus Tabak (WO 97/06250; 
SEQ ID NO: 47) 

45 b) Der PclpP-53 Promotor des clpP Gens als hoch-aktiver NEP 
Promotor in Chloroplasten (WO 97/06250; SEQ ID NO: 48) 
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c) Der Prrn-62 Promotor des rrn Gens (SEQ ID NO: 49) 

d) Der Prpsl6-107 Promotor des rpsl6 Gens (SEQ ID NO: 45): 

5 e) Der PatpB/E-290 Promotor des atpB/E Gens aus Tabak (Kapoor S 
et al. (1997) Plant J 11:327-337) (SEQ ID NO: 51) 

f ) Der PrpoB-345 Promotor des rpoB Gens (Liere K & Maliga P 
(1999) EMBO J 18: 249-257) (SEQ ID NO: 52) 

10 

Im Allgemeinen sind in dieser bevorzugten Aus ftihrungs form alle 
Promotoren nutzbar, die der Klasse III angehoren (Hajdukiewicz 
PTJ et al (1997) EMBO J 16:4041-4048) sowie alle Fragmente der 
Promotoren der Klasse II, die die Transkriptionsinitiation durch 
15 die NEP steuern. Solche Promotoren bzw. Promotor-Anteile sind 
nicht besonders hoch konserviert. Als Consensus nahe der Trans- 
kriptionsinitiationsstelle von NEP Promotoren wird angegeben: 
ATAGAATAAA (Hajdukiewicz PTJ et al (1997) EMBO J 16:4041-4048). 

20 Normalerweise werden Gene von regulatorischen Sequenzen ura- 

geben, die aus den Plastiden des zu transf ormierenden Organismus 
stammen. Dadurch erzeugt man Sequenzduplikationen, die zu In- 
stabilitaten aufgrund von spontanen, intrachromosomalen homologen 
Rekombinationsereignissen fuhren kSnnen (Heifetz PB (2000) Bio- 

25 chimie 82 (6-7) : 655-666) . Es wurde zur Losung dieses Problems vor- 
geschlagen, heterologe regulatorische Sequenzen zu nutzen, oder 
endogen im Plastidengenom bereits vorhandene regulatorische Ein- 
heiten auszunutzen (WO 99/46394; WO 01/42441) . Auch eine Ver- 
minderung der Homologie durch Mutagenese der endogenen Promotor- 

30 sequenz ist beschrieben (WO 01/07590) . 

Prinzipiell k6nnen alle nattirlichen Promotoren mit ihren 
Regulationssequenzen wie die oben genannten fur das erf indungs- 
gemafie Verfahren verwendet werden. Besonders bevorzugt sind Pro- 
35 motoren isoliert aus Prokaryoten. Ganz besonders bevorzugt sind 
Promotoren isoliert aus Synechocystis oder E.coli. Darilber hinaus 
konnen auch synthetische Promotoren vorteilhaft verwendet werden, 
wie beispielsweise ein synthetischer Promotor abgeleitet von der 
E. coli Konsensus Sequenz far C70 Promotoren: 

40 

5 ' -TTGACA N 16 _ 19 TATAAT N 3 CAT -3 ' , 

wobei N fxir jedes beliebige Nukleotid (also A, G ( C oder T) 
steht. Dem Fachmann ist of fensichtlich, dass auch einzelne bis 
45 wenige Basenaustausche in den angegebenen, konservierten Regionen 
moglich sind, ohne die Funktion des Promotors zu zerstdren. Die 
variable Gestaltung dieser synthetischen Promotoren durch Nutzen 
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verschiedener Sequenzabfolgen, erm6glicht es, eine Vielzahl von 
Promotoren zu erstellen, die nicht extensive Homologien aufwei- 
sen, was insbesondere fur den Fall, dass mehrere Promotoren bend- 
tigt werden, die Stabilitat der Expressionskassetten im Plastom 
5 erhoht. Beispielhaft aber nicht einschrankend seien nachfolgende 
besonders bevorzugte Promotorsequenzen genannt, die von oben ga- 
nannter Konsensussequenz abgeleitet sind: 

a) 5 ' -TTGACATTC ACTCTTC AATTATCTATAATGATACA- 3 ' (SEQ ID NO: 53) 
10 b) 5 ' -TTGAC AATTTTC C TCTG AATTATATAATTAAC AT - 3 ' (SEQ ID NO: 72) 

Dem Fachmann ist of f ensichtlich, dafi diese synthetischen Promoto- 
ren die Expression beliebiger Gene steuern kSnnen. Sie konnen 
beispielsweise dazu genutzt werden, die Expression eines Selek- 

15 tionsmarkers anzutreiben - auch, urn unter regenerativen Bedingun- 
gen auf transplastome Pflanzen unter Zuhilfenahme von besagtem 
Selektionssystem selektieren zu konnen. Selektionsmarker sind 
weiter unten beispielhaft aufgezahlt. Dartiber hinaus konnen sol- 
che synthetischen Promotoren mit jedem beliebigen Gen verknxipft 

20 werden, beispielsweise mit Genen kodierend fttr Antik6rper, Anti- 
gene oder Enzyme. Bevorzugt enthalten die Expressionskassetten 
bestehend aus solchen Promotoren auch im folgenden n&her be- 
schriebene 5'-untranslatierte Regionen (oder Ribosomenbindestel- 
len) oder 3 ' -nichtkodierende Regionen. 

25 

Ein weiterer Gegenstand der Erfindung betrif ft Expressions- 
kassetten enthaltend eine fur ein DSBI-Enzym kodierende 
NukleinsSureseguenz unter Kontrolle eines in pflanzlichen 
Plastiden funktionellen Promotors, beispielsweise eines der oben 
30 beschriebenen Promotoren. Die Expressionskassette kann weitere 
Elemente, wie beispielsweise Transkriptionsterminatoren und/oder 
Selektionsmarker beinhalten. 

Genetische Kontrollsequenzen umfassen auch weitere Promotoren, 
35 Promotorelemente oder Minimalpromotoren, die die expressions - 
steuernden Eigenschaf ten modifizieren konnen. Genetische Kon- 
trollsequenzen umfassen femer auch die 5 '-untranslatierte Region 
(5'-UTR) oder die nichtkodierende 3 '-Region (3'-UTR) von Genen 
(Eibl C (1999) Plant J 19: 1-13). Es ist gezeigt worden, dass 
40 diese eine signifikante Funktionen bei der Regulation der Gen- 
expression in Plastiden hdherer Pflanzen spielen kSnnen. Auch im 
Kern k6nnen genetische Kontrollelemente wie 5'-UTR, Introns oder 
3'UTR eine Funktion bei der Genexpression besitzen. So wurde bei- 
spielsweise gezeigt, dass 5 ' -untranslatierte Sequenzen die trans- 
45 iente Expression heterologer Gene verstarken konnen. Sie kdnnen 
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ferner die Gewebespezif itat ftfrdern (Rouster J et al., Plant J. 
1998, 15: 435-440.) . 

Bevorzugt werden als 5' UTRs und 3 'UTRs in Plastiden eingesetzt: 

5 

a) 5'psbA (aus Tabak) (SEQ ID NO: 54) 

b) 5'rbcL einschliefilich 5' Anteilen aus dem codierenden 
Bereich des rbcL Gens (aus Tabak) (SEQ ID NO: 55); die mit 

10 SEQ ID NO: 55 beschriebene Sequenz wurden gegenuber der 

nativen Sequenz mutiert, um eine PagI bzw. Ncol Schnitts telle 
einzubringen. 

c) 5'rbcLs (SEQ ID NO: 56); die mit SEQ ID NO: 56 beschriebene 
15 Sequenz wurden gegenuber der nativen Sequenz mutiert, um eine 

PagI Schnitts telle einzubringen. 

d) 3'psbA-l aus Synechocystis (SEQ ID NO: 57) 
20 e) 3'psbA aus Tabak (SEQ ID NO: 58) 

f) 3'rbcL aus Tabak (SEQ ID NO: 59) 

Genetische Kontrollsequenzen vor allem fur die Expression in 
25 Plastiden umfassen insbesondere auch Ribosomenbindungssequenzen 
zur Initiation der Translation. Diese sind fur gew5hnlich in den 
5 'UTRs enthalten. Dies ist vor allem dann bevorzugt, wenn von der 
zu exprimierenden Nukleins&uresequenz entsprechende Sequenzen 
nicht bereitgestellt werden oder diese mit dem Expressions- 
30 system kompatibel sind. Insbesondere bevorzugt ist die Ver- 
wendung einer synthetischen Ribosomenbindestelle (RBS) mit der 
Sequenz 5 ' -GGAGG(N) 3 - 10 ATG-3 ' , bevorzugt 5 ' -GGAGG (N) $ATG-3 ' 
(SEQ ID NO: 60) besonders bevorzugt 5 ' -GGAGGATCTCATG-3 ' 
(SEQ ID NO: 61) . 

35 

Die Expressionskassette kann vorteilhafterweise eine oder mehrere 
sogenannte "enhancer Sequenzen 0 funktionell verknttpft mit dem 
Promoter enthalten, die eine erhShte transgene Expression der 
Nukleinsauresequenz erm6glichen. Auch am 3'-Ende der transgen zu 
40 exprimierenden Nukleins&uresequenzen konnen zusatzliche vorteil- 
hafte Sequenzen insertiert werden, wie weitere regulatorische 
Elemente oder Terminatoren. Die transgen zu exprimierenden 
Nukleinsauresequenzen k6nnen in einer oder mehreren Kopien im 
Genkonstrukt enthalten sein. 

45 
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Ferner ist es m&glich, nach dem startcodon eine sogenannte Down- 
stream-Box einzufiigen, die die Expression im Allgemeinen steigert 
(Translations-'Enhancer" WO 00/07431; WO 01/21782). 

5 Als genetische Kontrollsequenzen v. a. bei der Kerntrans format ion 
geeignete Polyadenylierungssignale sind pflanzliche Polyadeny- 
lierungssignale/ vorzugsweise solche, die im wesentlichen T-DNA 
Polyadenylierungssignale aus Agrobakterium tumef aci ens, ins- 
besondere des Gens 3 der T-DNA (Octopin Synthase) des Ti-Plasmids 
10 pTiACHS entsprechen (Gielen et al. f EMBO J, 3 (1984), 835 ff) 
oder funktionelle Aquivalente davon. Beispiele fur besonders 
geeignete Terminatorsequenzen sind der OCS (Octopin-Synthase) - 
Terminator und der NOS ( Nopal in-Synthase) -Terminator . 

15 Die erfindungsgemSSen Transformationsvektoren und Insertions- 
sequenzen k6nnen weitere NukleinsSuresequenzen umfassen. Solche 
NukleinsSureseguenzen konnen bevorzugt Expressionskassetten 
darstellen. Beispielhaft aber nicht einschr&nkend ftlr die in 
den Expressionskonstrukten zu exprimierenden DNA-Sequenzen 

20 seien zu nennen: 

1 , Selektionsmarker 

"Selektionsmarker" meint all solche Nukleinsaure- oder Protein- 

25 sequenzen, deren Expression (d.h. Transkription und ggf . Trans- 
lation) einer Zelle, Gewebe oder Organismus einen anderen PhSno- 
typ verleiht, als einer nicht transf ormierten. Selektionsmarker 
umfasst beispielsweise solche NukleinsSure- oder Protein- 
sequenzen, deren Expression einer Zelle, Gewebe oder Organismus 

30 einen Vorteil (positiver Selektionsmarker) oder Nachteil 

(negativer Selektionsmarker) gegemlber Zellen vermittelt, die 
diese NukleinsSure oder Protein nicht exprimieren. Positive Se- 
lektionsmarker wirken beispielsweise dadurch, das eine auf die 
Zelle inhibitorisch wirkende Substanz detoxifiziert wird (Bsp. 

35 Antibiotika-/Herbizidresistenz) , oder eine Substanz gebildet 
wird, welche der Pflanze unter den gewahlten Bedingungen ver- 
besserte Regeneration oder erhohtes Wachstum erm5glicht (zum 
Beispiel nutritive Marker, hormonproduzierender Marker wie ipt; 
s.u.). Eine andere Form positiver Selektionsmarker umfasst 

40 mutierte Proteine oder HNAs, die gegenuber einem selektiven Agenz 
nicht empfindlich sind (beispielsweise 16S rRNA Mutanten, die 
unempf indlich gegentiber Spectinomycin sind) . Negative Selektions- 
marker wirken beispielsweise dadurch, dass sie die Bildung einer 
toxischen Substanz in den transformierten Zellen katalysieren 

45 (zum Beispiel das codA Gen) . Ferner kann Selektionsmarker auch 
Reporterproteine umfassen, insofern diese geeignet sind, trans - 
formierte von nicht-transf ormierten Zellen, Geweben oder Organen 
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(beispielsweise durch Farbgebung oder einen anderen detektier- 
baren Ph&iotyp) zu unterscheiden. 

Nachfolgende Selektionsmarker seien beispielhaft und nicht 
5 einschrankend zu nennen: 

1.1 Positive Selektionsmarker: 

Der mit der Expressionskassette in den Zellkern oder die 
10 Plastiden eingebrachte selektionierbare Marker verleiht den 
erfolgreich trans formier ten Zellen eine Resistenz gegen ein 
Biozid (zum Beispiel ein Herbizid wie Phosphinothricin, Glyphosat 
oder Bromoxynil), einen Metabolismusinhibitor wie 2-Desoxy- 
glucose- 6-phosphat (WO 98/45456) oder ein Antibiotikum, wie zum 
15 Beispiel Tetracycline, Ampicillin, Kanamycin, G 418, Neomycin, 
Bleomycin oder Hygromycin. Der Selektionsmarker erlaubt die 
Selektion der trans formierten Zellen von untransformierten 
(McCormick et al., Plant Cell Reports 5 (1986), 81-84; Dix PJ 
& Kavanagh TA (1995) Euphytica 85: 29-34). 

20 

Besonders bevorzugte Selektionsmarker sind solche, die eine 
Resistenz gegen Herbizide verleihen. Beispielhaft als Selektions- 
marker seien genannt: 

25 - DNA Sequenzen, die fiir Phosphinothricinacetyltransf erasen 
(PAT) kodieren, welche die freie Aminogruppe des Glutamin- 
synthaseinhibitors Phosphinothricin (PPT) acetylieren und 
damit eine Detoxif izierung des PPT erreichen (de Block et al. 
1987, EMBO J. 6, 2513-2518) (auch Bialophos® resistenzgen 

30 (bar) genannt) . Das bar Gen kodierend fur eine Phosphino- 

thricinacetyltransf erase (PAT) kann aus beispielsweise 
Streptomyces hygroscopicus oder S. viridochromogenes isoliert 
werden. Entsprechende Sequenzen sind dem Fachmann bekannt 
(aus Streptomyces hygroscopicus GenBank Acc.-No.: X17220 

35 und X05822, aus Streptomyces viridochromogenes GenBank 

Acc.-No.: M 22827 und X65195; US 5,489,520). Ferner sind 
synthetische Gene beispielsweise fiir die Expression in 
Plastiden beschrieben. Ein synthetisches Pat Gen ist be- 
schrieben in Becker et al. (1994) The Plant J. 5:299-307. 

40 Die Gene verleihen Resistenz gegen das Herbizid Bialaphos 

oder Glufosinat und sind vielbenutzer Marker in transgenen 
Pflanzen (Vickers JE et al. (1996). Plant Mol Miol Reporter 
14:363-368; Thompson CJ et al. (1987) EMBO J 6:2519-2523). 

45 - 5-Enolpyruvylshikimat-3-phosphatsynthasegene (EPSP Synthase- 
gene), die eine Resistenz gegen Glyphosat (N- (phosphono- 
methyDglycin) verleihen. Das unselektive Herbizid Glyphosat 
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hat die 5-Enolpyruvyl-3-phosphoshikimatsynthase (EPSPS) 
als molekulares Target. Diese hat eine Schltisselfunktion 
in der Biosynthese aromatischer Aminosauren in Mikroben und 
Pflanzen, jedoch nicht in SSugern (Steinrucken HC et al. 
5 (1980) Biochem. Biophys. Res. Commun. 94:1207-1212; Levin JG 

und. Sprinson DB (1964) J. Biol. Chem. 239: 1142-1150; Cole 
DJ (1985) Mode of action of glyphosate a literature analysis, 
p. 48-74. In: Grossbard E und Atkinson D (eds.). The herbi- 
cide glyphosate. Buttersworths, Boston.). Glyphosat-tolerante 

10 EPSPS Varianten werden bevorzugt als Selektionsmarker 

verwendet (Padgette SR et al. (1996). New weed control 
opportunities: development of soybeans with a Roundup Ready™ 
gene. In: Herbicide Resistant Crops (Duke, S.O., ed.), 
pp. 53-84. CRC Press, Boca Raton, FL; Saroha MK und Malik VS 

15 (1998) J Plant Biochemistry and Biotechnology 7:65-72). Das 

EPSPS Gen des Agrobakterium sp. strain CP4 hat eine natttr- 
liche Toleranz gegen Glyphosat, die auf entsprechende trans- 
gene Pflanzen transferiert werden kann. Das CP4 EPSPS Gen 
wurde aus Agrobakterium sp. strain CP4 kloniert (Padgette 

20 SR et al. (1995)Crop Science 35 (5) : 1451-1461) . Sequenzen 

von 5-Enolpyrvylshikimate-3-phosphate-synthasen, die 
Glyphosat-tolerant sind, wie beispielsweise beschrieben 
in US 5,510,471; US 5,776,760; US 5,864,425; US 5,633,435; 
US 5,627;061; US 5,463,175; EP 0 218 571, sind sowohl in 

25 den Patenten beschriebenen als auch in der GenBank hinter- 

legt. Weitere Sequenzen sind beschrieben unter GenBank 
Accession X63374. Ferner ist das aroA Gen bevorzugt (M10947 
S. typhimurium aroA locus 5-enolpyruvylshikimate-3-phosphate 
synthase (aroA protein) gene) . 

30 

das fur das Glyphosat® degradierende Enzyme kodierende 
gox Gen (Glyphosatoxidoreduktase) . GOX (beispielsweise die 
Glyphosatoxidoreductase aus Achromobacter sp.) katalysiert 
die Spaltung einer C-N Bindung im Glyphosat, welches so zu 
35 AminomethylphosphonsSure (AMPA) und Glyoxylat umgesetzt wird. 

GOX kann dadurch eine Resistenz gegen Glyphosat vermitteln 
(Padgette SR et al. (1996) J Nutr. 1996 Mar;126(3) :702-16; 
Shah D et al. (1986) Science 233: 478-481). 

40 - das deh Gen (kodierend ftir eine Dehalogenase , die Dalapon® 
inaktiviert) , (GenBank Ac c. -No. : AX022822, AX022820 sowie 
W099/27116) 

bxn Gene, die far Bromoxynil degradierende Nitrilase- 
45 enzyme kodieren. Beispielsweise die Nitrilase aus Klebsiella 

ozanenae. Sequenzen sind in der Genbank beispielsweise 
unter den Acc.-No: E01313 (DNA encoding bromoxynil specific 
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nitrilase) und J03196 (K. pneumoniae bromoxynil-specif ic 
nitrilase (bxn) gene, complete cds) zu finden. 

Neomycinphospho trans ferasen verleihen eine Resistenz 
5 gegen Antibiotika (Aminoglykoside) wie Neomycin, G418, 

Hygromycin, Paromomycin oder Kanamycin, indem sie durch 
eine Phosphorylierungsreaktion deren inhibierende Wirkung 
reduzieren. Besonders bevorzugt ist das nptll Gen. Sequenzen 
kSnnen aus der GenBank erhalten werden (AF080390 Mini- 

10 transposon mTn5-GNm; AF080389 Minitransposon mTn5-Nm, 

complete sequence) . Zudem ist das Gen bereits Bestandteil 
zahlreicher Expressionsvektoren und kann unter Verwendung 
von dem Fachmann gel&uf igen Verfahren (wie beispielsweise 
Polymerasekettenreaktion) aus diesen isoliert werden 

15 (AF234316 pCAMBIA-2301; AF234315 pCAMBIA-2300, AF234314 

pCAMBIA-2201) . Das NPTII Gen kodiert fur eine Aminoglycoside 
3 'O-phosphotransf erase aus E.coli, Tn5 (GenBank Acc.-No: 
U00004 Position 1401-2300; Beck et al. (1982) Gene 19 
327-336) . Dariiber hinaus kann auch das aphA-6 Gen aus Acine- 

20 tobacter jbaumannii, kodierend ftir eine Aminoglykosidphospho- 

transferase, als Selektionsraarker genutzt werden (Huang et 
al. (2002) Mol Genet Genomics 268:19-27) 

das DOGRl-Gen. Das Gen DOG^l wurde aus der Hefe Saccharomyces 
25 cerevisiae isoliert (EP 0 807 836). Es codiert fttr eine 

2-Desoxyglukose-6-phosphat Phosphatase, die Resistenz 
gegenttber 2-DOG verleiht (Randez-Gil et al. 1995, Yeast 11, 
1233-1240; Sanz et al. (1994) Yeast 10:1195- 1202, Sequenz: 
GenBank Acc.-No.: NC001140 chromosom VIII, Saccharomyces 
30 cervisiae Position 194799-194056) . 

Sulfonylurea- und Imidazolinon inaktivierende Acetolactat- 
synthasen, die eine Resistenz gegen Imidazolinon/Sulfonyl- 
urea-Herbizide verleihen. Beispielhaft seien far Imidazoli- 

35 non-Herbizide die Wirkstoffe Imazamethabenz-methyl , Imazza- 

mox, Imazapyr, Imazaquin, Imazethapyr zu nennen. Fur Sulfo- 
nylharnstof f-Herbizide seien beispielhaft Amidosulforon, 
Azimsulfuron, Chlorimuronethyl , Chlor sulfur on, Cinosulfuron, 
Imazosulforon, Oxasulforon, Prosulforon, Rimsulforon, Sulfo- 

40 sulforon zu nennen. Dem Fachmann sind zahlreiche weitere 

Wirkstoffe der genannten Klassen bekannt. Geeignet sind 
Nukleinsauresequenzen wie beispielsweise die unter der Gen- 
Bank Acc-No. : X51514 abgelegte Sequenz fur das Arabidopsis 
thaliana Csr 1.2 Gen (EC 4.1.3.18) (Sathasivan K et al. 

45 (1990) Nucleic Acids Res. 18(8):2188). Acetolactatesynthasen, 
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die eine Resistenz gegen Imidazolinon-Herbizide verleihen, 
sind ferner beschrieben unter den GenBank Acc.-No.: 

a) AB049823 Oryza sativa ALS mRNA for acetolactate synthase, 
5 complete cds, herbicide resistant biotype 

b) AF094326 Bassia scoparia herbicide resistant acetolactate 
synthase precursor (ALS) gene, complete cds 

10 c) X07645 Tobacco acetolactate synthase gene, ALS SuRB 

(EC 4.1.3.18) 

d) X07644 Tobacco acetolactate synthase gene, ALS SuRA 
(EC 4.1.3.18) 

15 

e) A19547 Synthetic nucleotide mutant acetolactate synthase 

f ) A19546 Synthetic nucleotide mutant acetolactate synthase 
20 g) A19545 Synthetic nucleotide mutant acetolactate synthase 

h) 105376 Sequence 5 from Patent EP 0257993 

i) 105373 Sequence 2 from Patent EP 0257993 
j) AL133315 



25 



Hygromycinphosphotransferasen (X74325 P. pseudomallei gene 
for hygromycin phosphotransferase) die eine Resistenz gegen 

30 das Antibiotikum Hygromycin verleihen. Das Gen ist Bestand- 

teil zahlreicher Expressionsvektoren und kann unter Verwen- 
dung von dem Fachmann gelSufigen Verfahren (wie beispiels- 
weise Polymerasekettenreaktion) aus diesen isoliert werden 
(AF294981 pINDEX4; AF234301 pCAMBIA-1380 ? AF234300 pCAM- 

35 BIA-1304; AF234299 pCAMBIA-1303 ; AF234298 pCAMBIA-1302 ; 

AF354046 pCAMBIA-1305 . ; AF354045 pCAMBIA-1305 . 1) 

Resistenzgene gegen 

40 a) Chloramphenicol (Chloramphenicolacetyltransferase) , 

b) Tetracyclin, verschiedene Resistenzgene sind beschrieben 
z.B. X65876 S. ordonez genes class D tetA and tetR 
for tetracycline resistance and repressor proteins 
45 X51366 Bacillus cereus plasmid pBC16 tetracycline 

resistance gene. Zudem ist das Gen bereits Bestandteil 
zahlreicher Expressionsvektoren und kann unter Verwendung 
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von dem Fachmann gelaufigen Verfahren (wie beispielsweise 
Polymerasekettenreaktion) aus diesen isoliert werden 

c) Streptomycin, verschiedene Resistenzgene sind beschrieben 
5 z.B. mit der GenBank Acc.-No. :AJ278607 Corynebacterium 

acetoacidophilum ant gene for streptomycin adenylyl- 
transf erase. 

d) Zeocin, das entsprechende Resistenzgen ist Bestandteil 
10 zahlreicher Klonierungsvektoren (z.B. L36849 Cloning. 

vector pZEO) und kann unter Verwendung von dem Fachmann 
gelaufigen Verfahren (wie beispielsweise Polymerase- 
kettenreaktion) aus diesen isoliert werden. 



15 e) Ampicillin (^-Lactamase Gen? Datta N, Richmond MH. 

(1966) Biochem J. 98(l):204-9; Heffron F et al (1975) 
J. Bacterid 122: 250-256; das Amp Gen wurde zuerst zur 
Herstellung des E. coli Vektors pBR322 kloniert; Bolivar 
F et al. (1977) Gene 2:95-114). Die Sequenz ist Bestand- 

20 teil zahlreicher Klonierungsvektoren und kann unter Ver- 

wendung von dem Fachmann gelSuf igen Verfahren (wie bei- 
spielsweise Polymerasekettenreaktion) aus diesen isoliert 
werden . 



25 - Gene wie die Isopentenyltransferase aus Agrobakterium 

tumefaciens (strain:P022) (Genbank Acc.-No. : AB025109) . Das 
ipt Gen ist ein Schllisselenzym der Cytokinin-Biosynthese. 
Seine Uberexpression erleichtert die Regeneration von 
Pflanzen (z.B. Selektion auf Cytokinin-freiem Medium). Das 

30 Verfahren zur Nutzung des ipt Gens ist beschrieben (Ebinuma H 

et al. (2000) Proc Natl Acad Sci USA 94:2117-2121; Ebinuma, H 
et al. (2000) Selection of Marker-free transgenic plants 
using the oncogenes (ipt, rol A, B, C) of Agrobakterium as 
selectable markers, In Molecular Biology of Woody Plants. 

35 Kluwer Academic Publishers). 

Verschiedene weitere positive Selektionsraarker , die den trans - 
formierten Pflanzen einen Wachstumsvorteil gegeniiber nicht-trans- 
formierten verleihen, sowie Verfahren zu ihrer Verwendung sind 

40 u.a. beschrieben in EP-A 0 601 092. Beispielhaft sind zu nennen 
^-Glucuronidase (in Verbindung mit z.B. Cytokininglucuronid) , 
Mannose-6-phosphat-Isomerase (in Verbindung mit Mannose) , UDP- 
Galaktose-4-Epimerase (in Verbindung mit z.B. Galactose), wobei 
Mannose-6-phosphat-Isomerase in Verbindung mit Mannose besonders 

45 bevorzugt ist. 
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Fiir einen in Plastiden funktionellen Selektionsmarker sind ins- 
besondere solche bevorzugt, die eine Resistenz gegen Spectino- 
mycin, Streptomycin, Kanamycin, Lincomycin, Gentamycin, Hygro- 
mycin, Methotrexat, Bleomycin, Phleomycin, Blast icidin, Sulfon- 
5 amid,, Phosphinotricin, Chlorsulfuron, Bromoxymil, Glyphosat, 
2,4Datrazin, 4-methyl tryptophan, Nitrat, S-aminoethyl-L-cysteine, 
Lysin/Threonin, Aminoethyl-Cystein oder Betainaldehyd verleihen. 
Besonders bevorzugt sind die Gene aadA, nptll, BADH, FLARE-S 
(eine Fusion aus aadA und GFP, beschrieben bei Khan MS & Maliga 
10 P, 1999 Nature Biotech 17: 910-915). 

Als in Plastiden funktionelle Selektionsmarker ist vor allem das 
aadA Gen beschrieben (Svab Z und Maliga P (1993) Proc Natl Acad 
Sci USA 90:913-917). Ferner beschrieben sind modifizierte 16S 

15 rDNA, das nptll G^n (Kanamycinresistenz) und das bar Gen (Phos- 
phinothricinresistenz) . Aufgrund der Bevorzugung des Selektions- 
marker aadA wird dieser bevorzugt "recycled" d.h. nach seiner 
Verwendung aus dem Genom bzw. Plastom deletiert (Fischer N et al. 
(1996) Mol Gen Genet 251:373-380; Corneille S et al. (2001) Plant 

20 J 27:171- 178), so dass aadA in weiteren Transfonnationen einer 
bereist transplastomen Pflanze wieder als Selektionsmarker be- 
nutzt werden kann. Als weiterer mSglicher Selektionsmarker ist 
die Betaine-aldehyd-Dehydrogenase (BADH) aus Spinat beschrieben 
(Daniell H et al. (2001) Trends Plant Science 6:237-239; Daniell 

25 H et al.( 2001) Curr Genet 39:109-116; WO 01/64023; WO 01/64024; 
WO 01/64850) . Auch lethal wirkende Agenzen wie beispielsweise 
Glyphosat k6nnen in Verbindung rait entsprechend detoxif izierenden 
oder resistenten Enzymen genutzt werden (WO 01/81605) . 

30 Es k6nnen auch binding type marker genutzt werden. Die Nutzen 
der als Insertionsstelle bevorzugten DBS-Erkennungssequenz der 
Homing-Endonuklease I-Cpal im Gen der 23S rRNA, wird wenigstens 
das 3*-Ende der Insertionssequenz (bevorzugt eines artif iziellen 
Introns) mit homologen Sequenzen der Zielregion umgeben. Es 

35 werden also Sequenzen der 23SrDNA in den Transformationsvektor 
aufgenommen. An einer Stelle (Position 2073 Oder 2074 der 23SrRNA 
aus Tabak, Sequenz: MAGACCCTATGAAG) k6nnen Punktmutationen 
eingefiihrt werden (z.B. Sequenz: SEAGACCCTATGAAG) , die den aus 
einer so mutierten 23SrDNA abgeleiteten Ribosomen Resistenz 

40 gegen\iber Lincomycin vermitteln (Cseplo A et al. (1988) Mol 
Gen Genet 214:295-299). Weitere Punktmutation umfassen solche 
in der 16S rRNA von Tabak, die Resistenz gegentiber Spectinomycin 
verleihen (Mutation unterstrichen) : 



45 a) 5 ' -GGAAGGTGAGGATGC-3 ' Cnativ" hier: A) 
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Andere Mutationen verleihen eine Resistenz gegen Strepomycin: 



b) 5 ' -GAATGAAACT&-3 ' Cnativ" hier: C) 

5 1.2 Negative Selektionsmarker 

Negative Selektionsmarker ermSglichen beispielsweise die Selek- 
tion von Organismen mit erfolgreich deletierten Sequenzen, die 
das Markergen umfassen (Koprek T et al. (1999) The Plant Journal 
10 19 (6) :719-726) . Beispielsweise k6nnen so fttr Selektionsmarker 
oder fur DSBI-Enzyme kodierende Sequenzen nach erfolgreicher 
Anwendung des erf indungsgem&fcen Verfahrens wieder aus dem Genom/ 
Plastom deletiert werden. 

15 Bei der negativen Selektion wird beispielsweise durch den in die 
Pflanze eingebrachten negativen Selektionsmarker eine Verbindung, 
die ansonsten far die Pflanze keine nachteilige Wirkung hat, in 
eine Verbindung mit nachteiliger Wirkung umgesetzt. Ferner sind 
Gene geeignet, die per se eine nachteilige Wirkung haben, wie zum 

20 Beispiel TK thymidine kinase (TK) und Diphtheria Toxin A Fragment 
(DT-A) , das codA Genprodukt kodierend fur eine Cytosindeaminase 
(Gleave AP et al. (1999) Plant Mol Biol 40(2) :223-35; Perera RJ 
et al. (1993) Plant Mol Biol 23(4): 793-799; Stougaard J (1993) 
Plant J 3:755-761), das . Cytochrom P450 Gen (Koprek et al. (1999) 

25 Plant J. 16:719-726), Gene kodierend fttr eine Haloalkan Dehalo- 
genase (Naested H (1999) Plant J. 18:571-576), das iaaH Gen 
(Sundaresan V et al. (1995) Genes & Development 9:1797-1810) oder 
das tms2 Gen (Fedoroff NV & Smith DL (1993) Plant J 3:273-289). 

30 Die jeweils fur die Selektion verwendeten Konzentrationen 

der Antibiotika, Herbizide, Biozide oder Toxine mtissen an die 
jeweiligen Testbedingungen bzw. Organismen angepasst werden. 
Beispielhaft seien fur Pflanzen zu nennen Kanamycin (Km) 50 bis 
100 mg/L, Hygromycin B 40 mg/L, Phosphinothricin (Ppt) 6 bis 20 

35 mg/L, Sepctinomycin (Spec) 15 bis 500 mg/L. 

Ferner ktfnnen funktionelle Analoga der genannten Nukleinsauren 
kodierend f\ir Selektionsmarker exprimiert werden. Funktionelle 
Analoga meint hier all die Sequenzen, die im wesentlichen die 
40 gleiche Funktion haben d.h. zu einer Selektion transf ormierter 
Organismen bef&higt sind. Dabei kann das funktionelle Analogon 
sich in anderen Merkmalen durchaus unterscheiden. Es kann zum 
Beispiel eine h6here oder niedrigere Aktivitat haben oder auch 
fiber weitere FunktionalitSten verfiigen. 

45 
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Funktionelle Analoga meint ferner Sequenzen, die far Fusions- 
proteine kodieren bestehend aus einem der bevorzugten Selektions- 
marker und einem anderen Protein zum Beispiel einem weiteren 
bevorzugten Selektionsmarker, einem der unten genannten Reporter- 
5 proteine oder einer PLS. Beispielhaf t sei eine Fusion des GFP 
(griin fluoreszierenden Proteins) und des aadA Gens genannt 
(Sidorov VA et al. (1999) Plant J 19:209-216). 

2 . Reportergene 

10 

Reportergene kodieren ftir leicht quant if izier bare Proteine, die 
uber Eigenfarbe oder EnzymaktivitcLt eine Bewertung der Trans- 
formationsef fizienz, des Expressionsortes oder -zeitpunktes oder 
die Identifizierung transgener Pflanzen gewShrleisten. Ganz be- 
15 sonders bevorzugt sind dabei Gene kodierend fiir Reporter-Proteine 
(siehe auch Schenborn E, Groskreutz D. Mol Biotechnol. 1999; 
13(1) :29-44) wie 

"green fluorescence protein" (GFP) (Chui WL et al., Curr 
20 Biol 1996, 6:325-330; Leffel SM et al., Biotechniques . 

23(5):912-8, 1997; Sheen et al. (1995) Plant Journal 
8(5) :777-784; Haseloff et al. (1997) Proc Natl Acad Sci 
USA 94(6) :2122-2127; Reichel et al. (1996) Proc Natl Acad 
Sci USA 93(12) :5888-5893; Tian et al. (1997) Plant Cell 
25 Rep 16:267-271; WO 97/41228). 

Chloramphenicoltransf erase , 

Luzif erase (Millar et al., Plant Mol Biol Rep 1992 
30 10:324-414; Ow et al . (1986) Science, 234:856-859); 

erlaubt Bioluminescenzdetektion. 

p-Galactosidase, kodiert far ein Enzym fiir das verschiedenen 
chromogene Substrate zur VerfUgung stehen. 

35 

p-Glucuronidase (GUS) (Jefferson et al., EMBO J. 1987, 6, 
3901-3907) oder das uidA Gen, das ein Enzym fUr verschiedene 
chromogene Substrate kodiert. 

40 - R-Locus Genprodukt: Protein, das die Produktion von Antho- 
cyaninpigmenten (rote FSrbung) in pflanzlichen Gewebe 
reguliert und so eine direkte Analyse der Promoteraktivitat 
ohne Zugabe zuscitzlicher Hilfsstoffe oder chromogener 
Substrate erm6glicht (Dellaporta et al., In: Chromosome 

45 Structure and Function: Impact of New Concepts, 18th Stadler 

Genetics Symposium, 11:263-282, 1988). 
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{J-Lactamase (Sutcliffe (1978) Proc Natl Acad Sci USA 
75:3737-3741), Enzym ftir verschiedene chromogene Substrate 
(z.B. PADAC, eine chromogenes Cephalosporin), 

5 - xylE Genprodukt (Zukowsky et al. (1983) Proc Natl Acad Sci 
USA 80:1101-1105), Catecholdi oxygenase, die chromogene 
Catechole umsetzen kann. 

Alpha-Amylase (Ikuta et al. (1990) Bio/technol. 8:241-242). 

10 

Tyrosinase (Katz et al. (1983) J Gen Microbiol 129:2703-2714), 
Enzym, das Tyrosin zu DOPA und Dopaquinon oxidiert, die 
infolge das leicht nachweisbare Melanin bilden. 

15 - Aequorin (Prasher et al.(1985) Biochem Biophys Res Commun 
126 (3) :1259-1268) , kann in der Calcium-sensitiven Bio- 
luminescenzdetektion verwendet werden. 

Der Selektionsmarker bzw. das Reportergen ist bevorzugt auf dem 
20 Trans formationskonstrukt, besonders bevorzugt auf der Insertions- 
sequenz kodiert. Er kann aber auch auf einem unabhangigen Trans- 
formationskonstrukt kodiert sein, welches in einer Co-Trans- 
formation mit dem Trans formationskonstrukt von Interesse in den 
Kern oder die Plastiden einer Pf lanzenzelle eingebracht wird. 

25 

Das erf indungsgemafie Transformationsvektoren und Insertions- 
sequenzen konnen weitere Funktionselemente enthalten. Der Begriff 
der weitere Funktionselemente ist breit zu verstehen. Bevorzugt 
sind all solche Elemente gemeint, die einen Einfluss auf Her- 
30 stellung, Vermehrung, Funktion, Nutzen oder Wert der im Rahmen 
des erf indungsgemaEen Verfahrens zum Einsatz kommenden Inserti- 
onssequenzen, Trans format ionskonstrukte oder -vektoren haben. 
Beispielhaft jedoch nicht einschr^nkend seien fur die weiteren 
Funktionselemente zu nennen: 

35 

i. Replikationsursprtinge (ORI; origin of DNA replication), die 
eine Vermehrung der erf indungsgemaSen Expressionskassetten 
oder Vektoren in zum Beispiel E. coli oder aber auch in 
Plastiden gew&hrleisten. Beispielhaft fiir E.coli ORIs seien 
40 genannt der pBR322 ori, der P15A ori (Sambrook et al.: Mole- 

cular Cloning. A Laboratory Manual, 2 nd ed. Cold Spring Harbor 
Laboratory Press, Cold Spring Harbor, NY, 1989) oder der 
colEl-ORI beispielsweise aus pBLUESCRIPT. Plastid&re ORI sind 
beschrieben in US 5,693,507, US 5,932,479 oder WO 99/10513. 

45 
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ii. Multiple Klonierungsregionen (MCS) erlauben und erleichtern 
die Insertion eines oder mehrerer Nukleinsaureseguenzen. 

iii. Sequenzen, die eine homologe Rekombination bzw. Insertion 

5 in das Genom bzw. Plastom eines Wirtsorganismus erm6glichen. 



iv. Elemente zum Beispiel n Bordersequenzen" , die einen Agro- 
bakterien-vermittelte Transfer in Pf lanzenzellen far die 
Ubertragung und Integration ins Pf lanzengenom ermSglichen, 
10 wie zum Beispiel die rechte oder linke Begrenzung der T-DNA 

oder die vir-Region. 



Die Einfuhrung einer Insertionssequenz oder eines Expressions- 
konstruktes far ein DSBI-Enzym kann vorteilhaft unter Verwendung 
15 von Vektoren realisiert werden, in die diese Konstrukte bzw. 
Kassetten insertiert werden. Vektoren k5nnen beispielhaft 
Plasmide, Cosmide, Phagen, Viren, Retroviren oder auch Agro- 
bacterien sein. 



20 In einer vorteilhaf ten Ausfuhrungsform wird die Einftihrung der 
Expressionskassette mittels Plasmidvektoren realisiert. Bevor- 
zugt sind solche Vektoren, die eine stabile Integration der 
Expressionskassette in das Wirtsgenom bzw. -plastom ermdglichen. 

25 Die Herstellung eines transf ormierten Organismus oder einer 
trans fonaier ten Zelle erfordert, dass die entsprechende DNA 
in die entsprechende Wirtszelle bzw. in die Plastiden derselben 
eingebracht wird. Ftir diesen Vorgang, der als Transformation 
bezeichnet wird, steht eine Vielzahl von Methoden zur Ver- 

30 ftigrung (siehe auch Keown et al. (1990) Methods in Enzymology 
185:527-537). So kann die DNA beispielhaft direkt durch Mikro- 
injektion, Elektroporation oder durch Bombardierung mit DNA-be- 
schichteten Mikropartikeln eingefuhrt werden. Auch kann die Zelle 
chemisch, zum Beispiel mit Polyethylenglycol , permeabilisiert 

35 werden, so dass die DNA durch Diffusion in die Zelle gelangen 
kann. Die Transformation kann auch durch Fusion mit anderen DNA- 
enthaltenden Einheiten wie Minicells, Zellen, Lysosomen oder 
Liposomen erfolgen. Zu nennen sind ferner die Transfektion unter 
Einsatz von Calciumphosphat, DEAE-Dextran oder kationischen 

40 Lipiden, Transduktion, Infektion, die Inkubation trockener 

Embryonen in DNA-hal tiger Losung, die Sonikation sowie die Trans- 
formation intakter Zellen oder Gewebe durch Mikro- oder Makro- 
injektion in Gewebe oder Embryonen, Gewebeelektroporation Oder 
die Vakuuminf iltration von Samen. Derartige Verfahren sind dem 

45 Fachmann geiaufig. Im Falle von Injektion oder Elektroporation 
von DNA in pflanzliche Zellen sind keine besonderen Anforderungen 
an das verwendete Plasmid gestellt. Einfache Plasmide wie die der 
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pUC-Reihe konnen verwendet werden. Sollen vollstandige Pflanzen 
aus den trans formier ten Zellen regeneriert werden, so ist es 
nutzlich, das sich auf dem Plasmid ein zus&tzliches selektionier- 
bares Markergen befindet. Auch die Verfahren zur Regeneration 
5 von Pflanzen aus Pf lanzengeweben oder Pf lanzenzellen sind be- 
schrieben. 

Es gibt verschiedene M6glichkeiten, die DNA in die Plastiden 
einzuschleusen. Fur die vorliegende Erfindung ist lediglich 

10 entscheidend, dass die DNA in die Plastiden eingebracht wird. 
Die vorliegende Erfindung ist jedoch nicht limit iert auf ein 
bestimmtes Verfahren. Jedes Verfahren, das ein Einbringen der 
zu transformierenden DNA in die Plastiden einer h6heren Pflanze 
erlaubt, ist geeignet. Die stabile Transformation von Plastiden 

15 ist ein dem Fachmann gel&uf iges Verfahren und wurde fur hohere 
Pflanzen beschrieben (u.a. bei Svab 2 und Maliga P (1993) Proc 
Natl Acad Sci USA 90 (3) : 913-917) . Die Methoden beruhen zum Bei- 
spiel auf einer Transformation mittels u Particle Gun" und einer 
Insertion in das plastidSre Genom durch homologe Rekombination 

20 unter Selektionsdruck. Weitere Methoden sind beschrieben in 
US 5,877,402. In EP-A 0 251 654 wird die DNA mittels Agro- 
bakterium tumefaciens eingeftthrt (s. De Block M et al. (1985) 
EMBO J 4:1367-1372; Venkateswarlu K und Nazar RN (1991) Bio/ 
Technology 9:1103-1105). Ferner wurde gezeigt, dass man mittels 

25 Elektroporation DNA in isolierte Chloroplasten einbringen und so 
eine transiente Expression erzielen kann (To KY et al. (1996) 
Plant J 10:737-743). Bevorzugt ist eine Transformation mittels 
eines direkten Transfers der DNA in Plastiden von Protoplasten 
beispielsweise unter Verwendung von PEG (Polyethylenglykol) 

30 (Koop HU et al. (1996) Planta 199:193-201; Kofer W et al. (1998) 
In Vitro Cell Dev Biol Plant 34:303-309; Dix PJ und Kavanagh TA 
(1995) Euphytica. 85:29-34; EP-A 0 223 247). Am meisten bevorzugt 
sind biolistische Transforroationsverfahren. Dabei wird die zu 
transformierende DNA auf z.B. Gold- oder Wolframpartikel auf- 

35 gebracht. Diese Partikel werden anschliefiend auf das zu trans- 
formierende Explantat beschleunigt (Dix PJ und Kavanagh TA (1995) 
Euphytica. 85:29-34; EP-A 0 223 247). AnschlieSend werden in 
der dem Fachmann gelSuf igen Weise transplastome Pflanzen unter 
Selektionsdruck auf geeignetem Medium regeneriert. Entsprechende 

40 Verfahren sind beschrieben (z.B. US 5,451,513; US 5,877,402; 

Svab Z et al. (1990) Proc Natl Acad Sci USA 87:8526-8530; Svab 2 
und Maliga P (1993) Proc Natl Acad Sci USA 90:913-917). Daruber 
hinaus kann die DNA mittels Mikroinjektion in die Plastiden ein- 
gebracht werden. Ein besonderes Verfahren der Mikroinjektion 

45 wurde kurzlich beschrieben (Knoblauch M et al. (1999) Nature Bio- 
tech 17:906-909; van Bel AJE et al. (2001) Curr Opin Biotechnol 
12:144-149). Dieses Verfahren ist fur die vorliegende Erfindung 
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besonders bevorzugt. Es ist auch m6glich, durch Protoplasten- 
fusion die Plastiden aus einer Art in eine andere Art einzu- 
bringen, diese dort zu trans formier en und anschlieSend durch 
Protoplastenfusion diese wieder in die ursprxingliche Art zu 
5 iiberftthren (WO 01/70939) . 

Neben diesen "direkten" Transf ormationstechniken kann eine Trans- 
formation auch durch bakterielle Infektion mittels Agrobakterium 
tumefaciens oder Agrobakterium rhizogenes durchgefuhrt werden 

10 (Horsch RB (1986) Proc Natl Acad Sci USA 83 (8) :2571-2575; Fraley 
et al. (1983) Proc Natl Acad Sci USA 80:4803-4807; Bevans et al. 
(1983) Nature 304:184-187). Die Expressionskassette beispiels- 
weise fur das DSBI-Enzym wird bevorzugt in spezielle Plasmide 
integriert, entweder in einen Zwischenvektor (englisch: shuttle 

15 or intermediate vector) oder einen bin^ren Vektor. Bevorzugt 
werden binare Vektoren verwendet. Binare Vektoren k6nnen sowohl 
in E. coli als auch in Agrobakterium replizieren und kSnnen 
direkt in Agrobakterium transf ormiert werden (Holsters et al. 
(1978) Mol Gen Genet 163:181-187). Verschiedene binSre Vektoren 

20 sind bekannt und teilweise kommerziell erhaitlich wie zum Bei- 
spiel pBINl9 (Clontech Laboratories, Inc. USA; Bevan et al.(1984) 
Nucl Acids Res 12:8711). Das Selektionsmarkergen erlaubt eine 
Selektion transformierter Agrobakteria und ist zum Beispiel 
das nptll Gen, das eine Resistenz gegen Kanamycin verleiht. 

25 Das Binarplasmid kann beispielsweise durch Elektroporation 
oder andere Trans format ionsmethoden in den Agrobakterienstamm 
iibertragen werden (Mozo & Hooykaas 1991, Plant Mol. Biol. 16, 
917-918) . Die Cokultur der pflanzlichen Explantate mit dem Agro- 
bakterienstamm findet in der Regel fiir zwei bis drei Tage statt. 

30 Das in diesem Fall als Wirtsorganismus fungierende Agrobakterium 
sollte bereits ein Plasmid mit der vir-Region enthalten. 
Viele StSmme von Agrobakterium tumefaciens sind in der Lage, 
genetisches Material zu tibertragen, wie z.B. die Steimme 
EHA101[pEHA101] (Hood EE et al. (1996) J Bacteriol 

35 168(3) : 1291-1301) , EHA105 [pEHA105] (Hood et al . (1993) Transgenic 
Research 2:208-218), LBA4404[pAL4404] (Hoekema et al. (1983) 
Nature 303:179-181), C58Cl[pMP90] (Koncz and Schell (1986) Mol 
Gen Genet 204:383-396) und C58C1 [pGV2260] (Deblaere et al. (1985) 
Nucl Acids Res 13: 4777-4788). 

40 

FQr den Transfer der DNA auf die pflanzliche Zelle werden 
pflanzliche Explantate mit Agrobakterium tumefaciens oder Agro- 
bakterium rhizogenes kokultiviert . Ausgehend von infiziertem 
Pflanzenmaterial (z.B. Blatt-, Wurzel- oder Stengelteile, aber 
45 auch Protoplasten oder Suspensionen von Pf lanzenzellen) k6nnen 
ganze Pflanzen unter Verwendung eines geeigneten Mediums, dass 
zum Beispiel Antibiotika oder Biozide zur Selektion trans- 
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formierten Zellen enthalten kann, regeneriert werden. Ein mit- 
trans formierter Selektionsmarker erlaubt die Selektion von trans- 
formierten Zellen von untransformierten (McCormick et al. (1986) 
Plant Cell Reports 5:81-84). Die erhaltenen Pflanzen konnen in 
5 ublicher Weise gezuchtet, geselbstet und gekreuzt werden. Zwei 
oder mehr Generationen sollten kultiviert werden, um sicher- 
zustellen, dass die genomische Integration stabil und vererblich 
ist. Die genannten Verfahren sind beispielsweise beschrieben 
bei Jenes B et al. (1993) Techniques for Gene Transfer, in: 
10 Transgenic Plants, Vol. 1, Engineering and Utilization, heraus- 
gegeben von Kung SD und Wu R, Academic Press, S. 128-143 sowie 
bei Potrykus (1991) Ann Rev Plant Physiol Plant Molec Biol 
42:205-225) . 

15 Die Agrobakterium-vermittelte Transformation ist am besten fttr 
dicotyledone Pf lanzenzellen geeignet, wohingegen die direkten 
Transformations techniken sich fttr jeden Zelltyp eignen. 

Die Agrobakterium-vermittelte Transformation wird besonders 
20 bevorzugt far die Kerntransformation, die direkten Trans- 
f ormationstechniken besonders bevorzugt fur die Plastiden- 
transformation eingesetzt. 

Sobald eine ttberwiegend homotransplastome Pf lanzenzelle nach dem 
25 erf indungsgema&en Verfahren hergestellt wurde, kann eine voll- 
standige Pf lanze unter Verwendung von dem Fachmann bekannten Ver- 
fahren erhalten werden. Hierbei geht man beispielhaft von Kallus- 
kulturen aus. Aus diesen noch undif ferenzierten Zellmassen kann 
die Bildung von Spross und Wurzel in bekannter Weise induziert 
30 werden. Die erhaltenen Spr6sslinge k6nnen ausgepflanzt und 
gezuchtet werden. 

De 1 e t i ons ver f ahr en 

35 Bei den beschriebenen erf indungsgemafcen Verfahren ist es auf 
verschiedenen Stufen vorteilhaft, bestimmte zuvor eingeftihrte 
Sequenzen (beispielsweise ftir Selektionsmarker und/oder DSBI- 
Enzyrae) wieder aus dem Plastom oder Genom der Pflanze oder Zelle 
zu entfernen. So ist es von Vorteil aber nicht zwingend erf order- 

40 lich, den Selektionsmarker, der beispielsweise bei der Insertion 
einer nicht -nattirlichen DBS-Erkennungssequenz eingeftihrt wurde, 
aus der Mas terpf lanze wieder zu entfernen, weil dann in einer 
nachfolgenden Transformation (z.B. mit der Insertionssequenz) 
wieder der gleiche Selektionsmarker genutzt werden kann. Eine 

45 Deletion ist insbesondere vorteilhaft, da der Selektionsmarker 
nach der Selektionsphase nicht mehr unbedingt erforderlich und 
daher ttberfltissig ist. Die Deletion erh6ht zudem die Verbraucher- 
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akzeptanz und ist unter zulassungstechnischen Uberlegungen 
wOnschenswert . Zudem wird der Proteinsyntheseapparat des 
Plastides nicht unnStig durch die Synthese des Markerproteins 
belastet, was sich potentiell vorteilhaft auf die Eigenschaften 
5 der entsprechenden Pflanze auswirkt. 

Zur gezielten Deletion von Sequenzen sind dem Fachmann ver- 
schiedenen Verfahren bekannt. Zu nennen ist beispielsweise 
jedoch nicht einschrankend die Excision mittels Rekombinasen . 

10 Verschiedene sequenzspezif ische Rekoinbinationssystemen sind 

beschrieben wie das Cre/lox- System des Bacteriophagen PI (Dale EC 
und Ow DW (1991) Proc Natl Acad Sci USA 88:10558-10562; Russell 
SH et al. (1992) Mol Gen Genet 234: 49-59; Osborne BI et al. 
(1995) Plant J. 7, 687-701), das FLP/FRT System der Hefe (Kilby 

15 NJ et al. (1995) Plant J 8:637-652; Lyznik LA et al. (1996) 
Nucleic Acids Res 24:3784-3789), die Gin Rekombinase des Mu 
Phagen, die Pin Rekombinase aus E. coli oder das R/RS System des 
pSRl Plasmids (Onouchi H et al. (1995) Mol Gen Genet 247:653-660; 
Sugita K et al. (2000) Plant J 22:461-469). Diese Verfahren sind 

20 nicht nur fiir die Deletion von DNA Sequenzen aus dem Kerngenom, 
sondern auch aus dem Plastom nutzbar (Corneille et al. (2001) 
Plant J 27: 171-178; Hajdukieicz et al. (2001) Plant J 
27:161-170). Als weitere Rekombinasen kCnnen beispielsweise 
eingesetzt werden: PhiC31 (Kuhstoss & Rao (1991) J Mol Biol 

25 222:897-908), TP901 (Christiansen et al. (1996) J Bacterid 
178:5164-5173), xisF aus Anabaena (Ramaswamy et al. (1997) Mol 
Microbiol 23:1241-1249), Integrase vom Phagen PhiLC3 (Lillehaug 
et al. (1997) Gene 188:129-136) oder die Rekombinase kodiert 
vom sre Gen des R4-Phagen (Matsuura et al. (1996) J Bacteriol 

30 178:3374-3376) . 

In einer bevorzugten Aus ftihrungs form wird die Deletion jedoch 
durch intrachromosomalen Rekombination aufgrund von entsprechend 
eingebrachten Sequenzduplikationen realisiert. Letzteres kann 

35 durch das gezielte Einftihren von DoppelstrangbrUchen nahe der 

Sequenz-Duplikationen in seiner Effizienz gesteigert werden (vgl. 
Fig. 8) . Dazu wird die zu deletierende Sequenz beidseitig von 
Homologiesequenzen HI und H2 flankiert, die eine ausreichende 
LSnge und Homologie aufweisen, urn miteinander zu rekombinieren. 

40 Die Rekombination wird durch die Induktion mindestens eines 
sequenzspezifischen Doppelstrangbruches nahe einer der beiden 
Homologiesequenzen gelegenen weiteren DSB-Erkennngs sequenz 
(die jedoch bevorzugt von der ersten verschieden ist) induziert. 
Bevorzugt ist diese DSB-Erkennungssequenz zwischen den beiden 

45 Homologiesequenzen lokalisiert. Zur Induktion des Doppelstrang- 
bruches wird bevorzugt ein zweites DSBI-Enzyro exprimiert oder 
eingebracht, das von dem ersten unterschieden ist. Besonders 
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bevorzugt wird dieses Verf ahren zur Deletion von Selektions- 
markern aus dem Plastom genutzt. 

Ein anderer Gegenstand der Erf indung betrifft die mit dem 
5 erf indungsgemaSen Verfahren hergestellten transplastomen, 
uberwiegend homoplastomen Pflanzen, sowie Teile derselben wie 
Blatter, Wurzeln, Samen, Fruchte, Knollen, Pollen oder Zell- 
kulturen, Kallus usw. - abgeleitet von solchen. 

10 Ein anderer Gegenstand der Erfindung betrifft die in dem 

erf indungsgemafien Verfahren zum Einsatz kommenden Pflanzen, die 
eine erf indungsgema&e Expressionskassette fur ein DSBI-Enzym oder 
ein Fusionsprotein aus PLS und DSBI-Enzym enthalten. Dabei liegt 
- besonders bevorzugt - die Expressionskassette far das Fusions- 

15 protein aus PLS und DSBI-Enzym unter Kontrolle eines im pflanz- 
lichen Zellkern funktionellen Promotors stabil integriert in die 
nukleclre DNA vor. Bevorzugt liegt die Expressionkassette kodie- 
rend fur ein DSBI-Enzym unter Kontrolle eines in pf lanzlichen 
Plastiden aktiven Promotors stabil integriert in das Plastom vor. 

20 Umfasst sind ferner Teile derselben wie Blatter, Wurzeln, Samen, 
Knollen, Fruchte, Pollen oder Zellkulturen, Kallus usw. - 
abgeleitet von vorgenannten Pflanzen. 

Von Menschen und Tieren verzehrbare erf indungsgemafce , genetisch 
25 veranderte Pflanzen konnen auch beispielsweise direkt oder nach 
an sich bekannter Aufbereitung als Nahrungsmittel oder Futter- 
mittel verwendet werden. 

Ein weiterer Gegenstand der Erfindung betrifft die Verwendung der 
30 oben beschriebenen erf indungsgemafien transplastomen, uberwiegend 
homoplastomen Pflanzen und der von ihnen abgeleitete Zellen, 
Zellkulturen, Teile - wie zum Beispiel bei transgenen pflanz- 
lichen Organismen Wurzeln, Blatter etc.-, und transgenes Ver- 
mehrungsgut wie Samen oder Fruchte, zur Herstellung von Nahrungs- 
35 oder Futtermitteln, Pharmazeutika oder Feinchemikalien. 

Feinchemikalien meint Enzyme wie beispielsweise die unten 
genannten industriellen Enzyme, Vitamine wie beispielsweise 
Tocopherolen und Tocotrienolen (z.B. Vitamin E) und Vitamin B2, 

40 Aminosauren wie beispielsweise Methionin, Lysin oder Glutamat, 
Kohlenhydrate wie beispielsweise Starke, Amylose, Amylopektin 
oder Saccharose, Fettsauren wie beispielsweise gesattigte, 
ungesattigte und polyungesattigte Fettsauren, natiirliche und 
synthetische Geschmacks-, Aromastoffe wie beispielsweise Linalo- 

45 ol, Menthol, Borneon (Kampfer) , Pinen, Limonen oder Geraniol 
und Farbstoffe wie beispielsweise Retinoide (z.B. Vitamin A), 
Flavonoide (z.B. Quercetin, Rutin, Tangeretin, Nobiletin) oder 
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Carotinoide (z.B. f$-Carotin, Lycopin, Astaxanthin) . Besonders 
bevorzugt ist die Produktion von Tocopherolen und Tocotrienolen 
sowie Carotinoiden. Die Ztichtung der trans formier ten Wirts- 
organismen sowie die Isolierung aus den Wirtsorganismen bzw. aus 
5 dem Ziichtungsmedium erfolgt mit dem Fachmann bekannten Verfahren. 
Die Produktion von Pharmazeutika, wie zum Beispiel AntikSrpern 
oder Vakkzinen ist beschrieben (Hood EE, Jilka JM. (1999) Curr 
Opin Biotechnol. 10 (4) :382-386; Ma JK und Vine ND (1999) Curr Top 
Microbiol Immunol. 23 6: 275-92 ) . 

10 

Insbesondere eignet sich das erfindungsgem&Se Verfahren zur Her- 
stellung von industriellen Enzymen im Rahmen eines sogenannten 
" Phytof arming" . Beispielhaft jedoch nicht einschrankend seien fiir 
die industriellen Enzyme zu nennen Lipasen, Esterasen, Proteasen, 
15 Nitrilasen, Acylasen, Epoxyhydrolasen, Amidasen, Phosphatases 
Xylanasen, Alkoholdehydrogenasen, Amylasen, Glucosidasen, 
Galactosidasen, Pullulanasen, Endocellulasen, Glucanasen, 
Cellulasen, Nukleasen, Chitindeacetylasen, Monoaminoxidasen, 
Lysozyme und Laccasen. 

20 

Im Rahmen der Erfindung insbesondere bevorzugte Ausftihrungsformen 
werden unten im Rahmen der Erlauterungen zu den Abbildungen nSher 
beschrieben . 

25 Sequenzen 

1. SEQ ID NO: 1 

pCB.42-94 Basisvektor far die Plastidentransforraation. 

30 2. SEQ ID NO: 2 

In die Multiple Klonierungsstelle von pCB42-94 (SEQ ID NO: 1) 
insertierte NukleinsSuresequenz . Resultierender Vektor: 
PCB199-3 . 

35 3. SEQ ID NO: 3 

In die Multiple Klonierungsstelle von pCB42-94 (SEQ ID NO: 1) 
insertierte Nukleinsauresequenz . Resultierender Vektor: 
PCB401-20 

40 4. SEQ ID NO: 4 

Expessionkassette aus pCB2 89-13 zur plastidaren Expression 
der I-Ppol Homing-Endonuklease. 

5. SEQ ID NO: 5 
45 Aminos&ureseguenz der durch die Expessionkassette aus 

PCB289-13 kodierten I-Ppol Homing-Endonuklease. 
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6. SEQ ID NO: 6 

Zur Erstellung des Vektors pCB3 04-25 eingesetztes Xhol / 
Bglll - Fragment. 

5 7. SEQ ID NO:7 

In die Multiple Klonierungsstelle von pGEMTeasy insertierte 
Nukleins&uresequenz . Resultierender Vektor: pCB220-17 

8. SEQ ID NO: 8 

10 In die Multiple Klonierungsstelle von pBluescript insertierte 

Nukleins&uresequenz . Resultierender Vektor: pCB270-l 

9. SEQ ID NO: 9 

Sequenz aus Vektor pCB315-l: LacZ-Gen mit insertiertem Intron 
15 zum Nachweis des Spleifcens. 

10. SEQ ID NO: 10 

Ll.LtrB Intron aus Vektor pCB345-34. 

20 11. SEQ ID NO: 11 

Synthetische Sequenz der Homing-Endonuklease I-Ppol (ORF: 16 
bis 507) 

12. SEQ ID NO: 12 

25 Proteinsequenz der Homing-Endonuklease I-Ppol 

13. SEQ ID NO: 13 

Nukleinsauresequenz der Homing-Endonuklease I-Cpal aus 
Chlamydomonas pallidostigmatica (Ver&nderungen zur verQffent- 
30 lichten Sequenz an Pos. 69. Am ATG wurde eine Ncol Schnitt- 

stelle eingeftthrt. (ORF: 4 bis 462) 

14. SEQ ID NO: 14 

Proteinsequenz der Homing-Endonuklease I-Cpal 

35 

15. SEQ ID NO: 15 

Sequenz enthaltend das CpLSU2 Intron 

16. SEQ ID NO: 16: Oligonukleotid-Primer pl9 
40 5 ' -TAAGGCCCTCGGTAGCAACGG-3 ' 

17. SEQ ID NO: 17: 01 igonukleot id- Primer p20 
5 ' -GGGGTACCAAATCCAACTAG-3 ' 

45 18. SEQ ID NO: 18: 01 igonukleot id-Primer p21: 
5 ' -GGAGCTCGCTCCCCCGCCGTCGTTC-3 ' 
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19. SEQ ID NO: 19: 01 igonukleot id- Primer p22 
5 ' -GATGCATGATGACTTGACGGCATCCTC-3 ' 

20. SEQ ID NO: 20: 01 igonukleot id- Primer pl90 
5 5 ' -GTCGACAGATCTTTAA-3 ' 

21. SEQ ID NO: 21: 01 igonukleot id-Primer pl91 
5 ' -AGATCTGTCGACTTAA- 3 ' 

10 22. SEQ ID NO: 22: 01 igonukleot id- Primer pl99 
5 ' -GATCTCCAGTTAACTGGGGTAC- 3 ' 

23. SEQ ID NO: 23: 01 igonukleot id- Primer p200 
5 ' -CCCAGTTAACTGGA- 3 ' 

15 

24. SEQ ID NO: 24: 01 igonukleot id- Primer p218 
5 ' -TTAAGCC AGTTAACTGGGCGGAGCT- 3 ' 

25. SEQ ID NO: 25: 01 igonukleot id- Primer p219 
20 5 ' -CCGCCCAGTTAACTGGC-3 ' 

26. SEQ ID NO: 26: 01 igonukleot id-Primer p276 
5 ' -TCGAGAAGATCAGCCTGTTATCCCTAGAGTAACT- 3 ' 

25 27. SEQ ID NO: 27: Oligonukleotid-Primer p277 
5 ' -CTAGAGTTACTCTAGGGATAACAGGCTGATCTTC- 3 ' 

28. SEQ ID NO: 28: Oligonukleotid-Primer p91 
5 ' -AGAAGACGATCCTAAGG-3 ' 

30 

29. SEQ ID NO: 29: Oligonukleotid-Primer p92 
5 ' -TGAAGACTTGAC AAGGAATTTC GC - 3 ' 

30. SEQ ID NO: 30: Oligonukleotid-Primer pl02 

35 5 ' -AGAAGACGATCCTAAATAGCAATATTTACCTTTSSG^CCAAAA 

31. SEQ ID NO: 31: Oligonukleotid-Primer p!03 

5 ' TGAAGACTTGACAAGGAATTTCGCTACCTTCGAGTACTCCAAAACTAATC-3 ' 

40 32. SEQ ID NO: 32: 01 igonukleot id- Prime p207 
5 ' -GAGAAGACATTCCTAACACATCCATAACGTGCG-3 ' 

33. SEQ ID NO: 33: 01 igonukleot id-Prime p208 
5 ' -TGAAGACTTGAC ATTTGATATGGTGAAGTAGG- 3 ' 

45 
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34. SEQ ID NO: 34 

Nukleinsauresequenz kodierend ftir das Transitpeptid der 
kleinen Untereinheit (SSU) der Ribulosebisphosphatcarboxylase 
(Rubisco ssu) aus Erbse 

5 

35. SEQ ID NO: 35 

Transitpeptid der kleinen Untereinheit (SSU) der Ribulose- 
bisphosphatcarboxylase (Rubisco ssu) aus Erbse 

10 36. SEQ ID NO: 36 

Transitpeptid der plastidaren Transketolase aus Tabak. 

37. SEQ ID NO: 37 

Nukleinsauresequenz kodierend fiir das Transitpeptid der 
15 plastidaren Transketolase aus Tabak (Leseraster 1; pTP09) 

38. SEQ ID NO: 38 

Nukleinsauresequenz kodierend fiir das Transitpeptid der 
plastidaren Transketolase aus Tabak (Leseraster 2; pTPIO) 

20 

39. SEQ ID NO: 39 

Nukleinsauresequenz kodierend fur das Transitpeptid der 
plastidaren Transketolase aus Tabak (Leseraster 3; pTPll) 

25 40. SEQ ID NO: 40 

Transitpeptid der plastidaren Isopentenylpyrophosphat 
Isomerase-2 (IPP-2) aus Arabidopsis thaliana. 

41. SEQ ID NO: 41 

30 Nukleinsauresequenz kodierend fur das Transitpeptid der 

plastidaren Isopentenylpyrophosphat Isomerase-2 (IPP-2) 
aus Arabidopsis thaliana (Leseraster 1; IPP-9) 

42. SEQ ID NO: 42 

35 Nukleinsauresequenz kodierend ftir das Transitpeptid der 

plastidaren Isopentenylpyrophosphat Isomerase-2 (IPP-2) 
aus Arabidopsis thaliana (Leseraster 2; IPP-10) 

43. SEQ ID NO: 43 

40 Nukleinsauresequenz kodierend fur das Transitpeptid der 

plastidaren Isopentenylpyrophosphat Isomerase-2 (IPP-2) 
aus Arabidopsis thaliana (Leseraster 3; IPP-11) 



44. 

45 



SEQ ID NO: 44 

Nukleinsauresequenz kodierend fiir den PrbcL Promotor aus 
Tabak. 
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45. SEQ ID NO: 45 

Nukleinsauresequenz kodierend fttr den Prpsl6-107 Promotor aus 
Tabak. 

5 46. SEQ ID NO: 46 

Nukleinsauresequenz kodierend fttr den Prrnl6 Promotor aus 
Tabak . 

47. SEQ ID NO: 47 

10 Nukleinsauresequenz kodierend fiir den PaccD-129 Promotor aus 

Tabak . 

48. SEQ ID NO: 48 

Nukleinsauresequenz kodierend fur den PclpP-53 Promotor aus 
15 Tabak . 

49. SEQ ID NO: 49 

Nukleinsauresequenz kodierend fiir den Prrn-62 Promotor aus 
Tabak. 

20 

50. SEQ ID NO: 50 

Nukleinsauresequenz kodierend fttr den Prpsl6 Promotor aus 
Tabak. 

25 51. SEQ ID NO: 51 

Nukleinsauresequenz kodierend fttr den PatpB/E-290 Promotor 
aus Tabak. 

52. SEQ ID NO: 52 

30 Nukleinsauresequenz kodierend fttr den PrpoB-345 Promotor aus 

Tabak. 

53. SEQ ID NO: 53 

Nukleinsauresequenz kodierend fur einen Promotor abgeleitet 
35 von der Konsensussequenz der a70 Promotoren aus E.coli. 

54. SEQ ID NO: 54 

Nukleinsauresequenz kodierend fttr die 5'-untranslatierte 
Region des psbA Gens aus Tabak <5'psbA) 

40 

55. SEQ ID NO: 55 

Nukleinsauresequenz kodierend fttr die 5' -untranslatierte 
Region einschliefilich 5' Anteilen aus dem kodierenden Bereich 
des rbcL Gens aus Tabak (5'rbcL). 

45 
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56. SEQ ID NO: 56 

NukleinsSuresequenz kodierend ftir die 5 ' -untranslatierte 
Region des rbcLs Gens aus Tabak. 

5 57. SEQ ID NO: 57 

Nukleinsauresequenz kodierend ftir die 3 ' -untranslatierte 
Region des psbA-1 Gens aus Synechocystis (3'psbA-l) 

58. SEQ ID NO: 58 

10 NukleinsSuresequenz kodierend fur die 3 ' -untranslatierte 
Region des psbA Gens aus Tabak (3'psbA) 

59. SEQ ID NO: 59 

Nukleins&uresequenz kodierend ftir die 3 '-untranslatierte 
15 Region des rbcL Gens aus Tabak (3'rbcL) 

60. SEQ ID NO: 60 

Nukleinscluresequenz kodierend fiir synthetische Ribosomen- 
bindestellen (RBS) 

20 

61. SEQ ID NO: 61 

Nukleins&uresequenz kodierend fiir synthetische Ribosomen- 
bindestelle (RBS) 

25 62. SEQ ID NO: 62 

VollstSndiges Insert des Vektors pCB3 04-25 

63. SEQ ID NO: 63 

Bglll / Muni Fragment des Vektors pCB320-192. 

30 

64. SEQ ID NO: 64: 01 igonukleot id- Primer p93 
5 ' - AAAGATCTCCTC ACAAAGGGGGTCG- 3 ' 

65. SEQ ID NO: 65: 01 igonukleot id- Primer p97 
35 5 ' -TCGAAGACTTAGGACCGTTATAG- 3 ' 

66. SEQ ID NO: 66: 01 igonukleot id- Primer p98 
5 ' -AGGAAGACCTTGTCGGGTAAGTTCCG-3 ' 

40 67. SEQ ID NO: 67: 01 igonukleot id-Primer p95: 
5 ' -CTCAATTGGGGTCTCTCTGTCCAGGTGCAGG-3 ' 

68. SEQ ID NO: 68: Nukleins&uresequenz kodierend fur Fusions- 
proteine aus der nativen I-Ppo-I Nuklease und der der 
45 IPP-Plastidenlokalisationssequenz (ORF far I-Ppol: 181-672; 

IPP-Transitpeptid: 1-180; native Sequenz von 1-172). 
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69. SEQ ID NO: 69: Fusionsproteine aus der nativen I-Ppo-I 
Nuklease und der der IPP-Plastidenlokalisationssequenz . 

70. SEQ ID NO: 70: Nukleinsauresequenz kodierend fur lange Ver- 
5 sion der I-Ppol Homing -Endonuklease . 

71. SEQ ID NO: 71: Aminosauresequenz kodierend fur lange Version 
der I-Ppol Homing-Endonuklease. 

10 72. SEQ ID NO: 72: Nukleinsauresequenz kodierend fur eine 

Promotorsequenz abgeleitet von der 
Konsensussequenz der a70 Promotoren 
aus E,coli. 

15 73. SEQ ID NO: 73: Nukleinsauresequenz kodierend fur das 

kiinstliche Intron TetIVS2a. 

74. SEQ ID NO: 74: Insert des Vektors pCB459-l 

20 75. SEQ ID NO: 75: Insert des Vektors pCB478-3 

76. SEQ ID NO: 76: Insert des Vektors pCB492-25 

77. SEQ ID NO: 77: Oligonukleotidprimer p396 

25 5 ' -TAGTAAATGAC AATTTTC CTCTGAATTATATAATTAAC ATGGCG ACTGTTTAC C AAAA 

AC-3 

78. SEQ ID NO: 78: Oligonukleotidprimer p95 

5 ' -CTCAATTGGGGTCTCTCTGTCCAGGTGCAGG-3 ' 

30 

79. SEQ ID NO: 79: Nukleinsauresequenz kodierend fur PCR Produkt 

Pr om-Te t IVS2 a-Cpa 

80. SEQ ID NO: 80: Insert des Vektors pCB435-45 

35 

81. SEQ ID NO: 81: Nukleinsauresequenz kodierend fur Sonde fur 

Southernblot-Analyse (gerichtet gegen Teile 
der 16SrDNA) . 

40 82. SEQ ID NO: 82: Nukleinsauresequenz kodierend far Sonde fur 

Southernblot-Analyse (gerichtet gegen Teile 
der 23SrDNA) . 

83. SEQ ID NO: 83: Insert des Vektors pCB456-2 

45 

84. SEQ ID NO: 84: Insert des Vektors pCB528-2, von Kpnl bis SacI 
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Im Rabmen des erf indungsgemafcen Verfahrens sind insbesondere die 
in nachfolgenden Abbildungen verdeutlichten Ausfiihrungsf ormen 
5 besonders bevorzugt. Fur die Abbildungen gelten allgemein nach- 
folgende Abktirzungen: 



A, A' Paar homologer Sequenzen A und A' 

A/A' Ergebnis einer homologen Rekombination zwischen A und A' 
10 und/ oder eines durch Reperatursynthese bedingten Aus- 

tausches zwischen A und A' . 

B, B' Paar homologer Sequenzen B und B' 

B/B' Ergebnis einer homologen Rekombination zwischen B und B' 
und/oder eines durch Reperatursynthese bedingten Aus- 
15 tausches zwischen B und B' . 

HI, H2: Paar homologer Sequenze Hi und H2 

Hl/2: Sequenz als Ergebnis der homologen Rekombination aus HI 
und H2 

DS funktionelle DSB-Erkennungssequenz 

20 nDS nicht funktionelle "Halbseite" einer DSB-Erkennungs- 

sequenz 
E: DSBI-Enzym 
P : Promoter 

I: weitere NukleinsSuresequenz (Gen von Interesse) 

25 S, S' Positive Selektionsmarker 
NS Negativer Selektionsmarker 

IS Intronsequenzen. Das Intron ist insgesamt als Box gekenn- 



. zeichnet. Die Box umfasst alle fur ein f unktionelles 
Intron erforderlichen Elemente. 

30 

Wie bereits oben beschrieben stellt A/A' bzw. B/B' das Ergebnis 
einer homologen Rekombination und/oder eines durch Reperatur- 
synthese bedingten Austausches dar. Die resultierende Sequenz 
kann wiederum Ausgangssequenz ftir weitere homologe Rekombi- 
35 nationen bzw. Reperatursynthesen sein. Zur Vereinfachung wird 
diese Sequenz (A/A' bzw. B/B') in nachfolgenden Schritten wieder 
als A bzw. B bezeichnet. 

1. Fig. 1: Einfiihrung einer DSB-Erkennungs sequenz in das Plastom 
40 mittels Doppeltem "Cross-Over" 

In einer besonders bevorzugten Aus ftihrungs form 1 wird zunachst 
ein DSBE-Konstrukt in Plastiden einer heheren Pf lanze ein- 
gebracht. Das DSBE-Konstrukt wird in dieser AusfOhrungsf orm 
45 bevorzugt mit homologen Zielregionen und mit einem exprimierbaren 
Selektionsmarker (Promotor - 5'OTR - Selektionsmarker - 3'UTR) 
ausgerUstet und enthait in dieser Aus fiihrxings form bevorzugt eine 
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Erkennungsregion fur ein DSBI-Enzym, welches bevorzugt keine 
natiirliche Erkennungssequenz im Plastidengenom der (nicht-trans- 
formierten) betrachteten Pflanze besitzt. Das DSBE-Konstrukt kann 
- optional - bereits weitere Gene von Interesse kodieren. Es 
5 werden uberwiegend homoplastome Masterpf lanzen erzeugt (Fig. 1) . 

2. Fig.2A-E: Einfuhrung einer Insertionssequenz mit einer 

Expressionskassette fur eine DSBI-Enzym und ggf . 
Selektionsmarker sowie weiteren Genen von Interesse 

10 

Explantate der durch Ausfuhrungsform 1 hergestellten Master- 
pflanzen werden fur eine weitere Transformation mit einem er- 
findungsgemSSen Transformationskonstrukt genutzt. Das erfindungs- 
gemafie Transformationskonstrukt besitzt bevorzugt beidseitig 
15 (Fig. 2A, 2B) oder einseitig (Fig. 2C, 2D) der Insertionssequenz 
Bereiche, die homolog zum den Sequenzen umgebend die Insert ions- 
stelle des DSBE-Konstruktes sind. Die Insertion erfolgt dann 
uber homologe Rekombination (z.B. Cross-Over) bzw. uber eine 
Reperatursynthese . 

20 

Besonders bevorzugt sind die zu insertierenden Sequenzen - nach 
innen an die Homologiesequenzen anschlieSend - von Teilen der 
DSB-Erkennungssequenz f lankiert (nDS) , die den in Folge eines 
Schnittes mit dem DSBI-Enzym entstehenden Teilen, entsprechen 
25 (Fig. 2B) . Somit enthalt die Insertionssequenz Sequenzen, die den 
in Folge eines Schnittes im Plastom entstehenden Enden unmittel- 
bar entsprechenden und so einen besonders effizienten Einbau 
gewMhrleisten. 

30 Besitzt das Transformationskonstrukt bzw. die Insertionssequenz 
keine solche homologen Bereiche, wird die Insertionssequenz an 
diesen Enden bevorzugt mit iiberhangenden Enden versehen, die auch 
von dem DSBI-Enzym nach Schneiden des Plastoms der Masterpf lanze 
erzeugt werden (Fig. 2E) . 

35 

Liegt nur eine Homologiesequenz vor, so grenzt an diese in einer 
besonders bevorzugten Ausfuhrungsform eine nDS-Sequenz (s.o. 
wie fUr Fig. 2B beschrieben) an, wShrend die andere Seite der 
Insertionssequenz mit tiberh&ngenden Enden versehen ist, die den 
40 vom DSBI-Enzym im Plastom der Masterpf lanze erzeugten entsprechen 
(Fig. 2D) . 

Optional kodiert die Insertionssequenz fur einen weiteren, 
exprimierbaren Selektionsmarker, der sich funktionell von dem 
45 des DSBE-Konstruktes unterscheidet , ggf. ein oder mehrere 
exprimierbare Gene von Interesse und das exprimierbare DSBI- 
Enzym, welches die durch das DSBE-Konstrukt eingebrachte 
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Erkennungssequenz an der Insertionsstelle im Plastidengenom der 
Masterpf lanze schneidet. Die Insertion der Insertionssequenz des 
Trans formationskonstruktes erfolgt dabei an einer Stelle derart, 
dass besagte Erkennnngsregion nach der Insertion nicht mehr 
5 funktionell ist. 

3. Fig. 3: Einftihrung einer DSB-Erkennungssequenz in das 

Plastom mittels Doppeltem ^Cross-Over" in einen 
transkriptionell aktiven Bereich 

10 

In einer weiteren, besonders bevorzugten Ausfiihrungsf orm 2 wird 
zunachst ein DSBE-Konstrukt in Plastiden einer hdheren Pflanze 
eingebracht. Das DSBE-Konstrukt wird in dieser Ausfiihrungsf orm 
bevorzugt mit homologen Zielregionen und mit einem exprimierbaren 

15 Selektionsmarker ausgerustet, wobei ein endogener Promotor des 
Plastoms dazu genutzt wird, und enth&lt zusatzlich bevorzugt eine 
Erkennungsregion ftir ein DSBI-Enzym, welches bevorzugt keine 
natttrliche Erkennungssequenz im Plastidengenom der (nicht-trans- 
formierten) betrachteten Pflanze besitzt. Das DSBE-Konstrukt kann 

20 bereits far Gene von Interesse kodieren. Es werden uberwiegend 
homoplastome Masterpf lanzen erzeugt (Fig. 3). 

4. Fig . 4A-E : Einftihrung einer Insertionssequenz mit einer Kassette 

kodierend fiir eine DSBI-Enzym und ggf . Selektions- 
25 marker sowie weiteren Genen von Interesse 

Explantate der durch Ausfiihrungsf orm 2 hergestellten Master- 
pflanzen werden fur eine weitere Transformation mit einem er- 
findungsgemSiSen Transformationskonstrukt genutzt. Das erfindungs- 

30 gemSSe Transformationskonstrukt besitzt bevorzugt beidseitig 

(Fig. 4A # 4B) oder einseitig (Fig. 4C, 4D) der Insertionssequenz 
Bereiche, die homolog zum den Sequenzen umgebend die Insertions- 
stelle des DSBE-Konstruktes sind. Die Insertion erfolgt dann Ober 
homologe Rekombination (z.B. Cross-Over) bzw. eine Reperatur- 

35 synthese. Besonders bevorzugt sind die zu insertierenden 

Sequenzen - nach innen an die Homologiesequenzen anschlieSend - 
von Teilen der DSB-Erkennungssequenz f lankier t (nDS) , die den 
in Folge eines Schnittes mit dem DSBI-Enzym entstehenden Teilen, 
entsprechen (Fig. 4B) . Somit en thai t die Insertionssequenz 

40 Sequenzen, die den in Folge eines Schnittes im Plastom ent- 
stehenden Enden unmittelbar entsprechenden und so einen besonders 
effizienten Einbau gewahrleisten. 

Besitzt das Transformationskonstrukt bzw. die Insertionssequenz 
45 keine solche homologen Bereiche, wird die Insertionssequenz an 
diesen Enden bevorzugt mit Oberhangenden Enden versehen, die auch 
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von dem DSBI-Enzym nach Schneiden des Plastoms der Masterpf lanze 
erzeugt werden (Fig. 4E) . 

Liegt nur eine Homologiesequenz vor, so grenzt an diese in einer 
5 besonders bevorzugten Ausftihrungsf orm eine nDS-Sequenz (s.o. 
wie fur Fig. 4B beschrieben) an, WcLhrend die andere Seite der 
Insertionssequenz mit uberh&ngenden Enden versehen ist, die den 
vom DSBI-Enzym im Plastom der Masterpf lanze erzeugten entsprechen 
(Fig. 4D) . 

10 

Optional kodiert die Insertionssequenz ftir einen weiteren, 
exprimierbaren Selektionsmarker, der sich funktionell von dem 
des DSBE-Konstruktes unterscheidet , ggf . ein oder mehrere 
exprimierbare Gene von Interesse und das expriraierbare DSBI- 

15 Enzym, welches die durch das DSBE-Konstrukt eingebrachte 

Erkennungssequenz an der Insertionsstelle im Plastidengenom der 
Masterpf lanze schneidet. Die Insertion der Insertionssequenz 
des Trans format ionskonstruktes erfolgt dabei an einer Stelle 
derart, dass besagte Erkennungsregion nach der Insertion nicht 

20 mehr funktionell ist, 

5. Fig. 5A-E: Einfiihrung einer Insertionssequenz mit einer Kassette 
kodierend fur eine DSBI-Enzym und ggf. Selektions- 
marker sowie weiteren Genen von Interesse unter 
25 Nutzung naturlicher, endogener DSB-Erkennungs- 

sequenzen 

In einer weiteren, ganz besonders bevorzugten Ausftthrungsform 3 
enthait ein erf indungsgemSSes Trans format ionskonstrukt ein 
30 exprimierbares DSBI-Enzym, welches eine endogene, natiirliche 
Erkennungssequenz im Plastom der betrachteten Pf lanze besitzt. 

Explantate dieser nattirlichen Masterpf lanzen werden ftir 

eine Transformation mit einem erf indungsgem&Sen Trans format ions - 

35 konstrukt genutzt. Das erf indxingsgemaEe Trans format ionskonstrukt 
besitzt bevorzugt beidseitig (Fig. 5A, 5B) oder einseitig 
(Fig. 5C, 5D) der Insertionssequenz Bereiche, die homolog zum 
den Sequenzen umgebend die Insertionsstelle des DSBE-Konstruktes 
sind. Die Insertion erfolgt dann iiber homologe Rekombination 

40 (z.B. Cross-Over) bzw. Reperatursynthese . 

Besonders bevorzugt sind die zu insertierenden Sequenzen - nach 
innen an die Homologiesequenzen anschliefiend - von Teilen der 
DSB-Erkennungssequenz f lankier t (nDS), die den in Folge eines 
45 Schnittes mit dem DSBI-Enzym entstehenden Teilen, entsprechen 

(Fig. 5B) . Somit enthait die Insertionssequenz Sequenzen, die den 
in Folge eines Schnittes im Plastom entstehenden Enden unmittel- 
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bar entsprechenden und so einen besonders ef fizienten Einbau 
gewahrleisten. 

Besitzt das Transf ormationskonstrukt bzw. die Insertionssequenz 
5 keine solche homologen Bereiche, wird die Insert ionssequenz an 
diesen Enden bevorzugt mit tiberhangenden Enden versehen, die auch 
von dem DSBI-Enzym nach Schneiden des Plastoms der Masterpf lanze 
erzeugt werden (Fig. 5E) . 

10 Liegt nur eine Homologiesequenz vor, so grenzt an diese in einer 
besonders bevorzugten AusfGhrungsform eine nDS-Sequenz (s.o. 
wie ftir Fig. 5B beschrieben) an, wahrend die andere Seite der 
Insertionssequenz mit tiberh&ngenden Enden versehen ist, die den 
vom DSBI-Enzym im Plastom der Masterpf lanze erzeugten entsprechen 

15 (Fig. 5D). 

Die Insertion der Insertionssequenz des Transf ormat ions - 
konstruktes erfolgt dabei bevorzugt an einer Stelle derart, 
dass besagte Erkennungsregion nach der Insertion nicht mehr 
20 funktionell ist. Die Insertionssequenz kodiert bevorzugt ftir 
einen exprimierbaren Selektionsmarker (S'), ein oder mehreren 
Genen von Interesse sowie fur das exprimierbare DSBI-Enzym. Der 
Selektionsmarker ist optional. 

25 6. Fig . 6A-E : Einftihrung einer Insertionssequenz mit einer Kassette 
kodierend far Gene von Interesse und ggf . Selektions- 
marker und Einbringung eines DSBI-Enzyms in trans 

In weiteren bevorzugten Ausfuhrungsformen 4 wird das DSBI Enzym 
30 nicht von dem Trans f ormationskonstrukt kodiert, sondern entweder 
in trans exprimiert (in Plastiden oder als PLS-Fusionsprotein 
im Kern) bzw. in Form von RNA oder als Protein in die Plastiden 
transf iziert. Das DSBI-Enzym erkennt entweder eine kiinstlich 
eingeftthrte (Fig. 6A, 6B) oder natttrliche (Fig. 6C, 6D) DSB- 
35 Erkennungssequenz. Diese Ausftihrungsform ist insbesondere dann 
bevorzugt, wenn das Transf ormationskonstrukt keine Promotor- 
elemente umfasst, und eine Expression der kodierten Gene erst 
nach Insertion in das Plastom unter Verwendung plastid&rer, 
endogener Promo toren realisiert wird. 

40 

Wie bei den bereits oben beschriebenen Ausftthrungsbeispielen 
besitzt das Trans format ionskonstrukt bevorzugt beidseitig 
(Fig. 6A, 6B) oder einseitig (nicht gezeigt) der Insertions- 
sequenz Bereiche, die homolog zum den Sequenzen umgebend die 
45 Insertionsstelle des DSBE-Konstruktes sind. Die Insertion erfolgt 
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dann tiber homologe Rekombination (z.B. Cross-Over) bzw. 
Reperatursynthese . 

Besonders bevorzugt sind die zu insertierenden Sequenzen - nach 
5 innen an die Homologiesequenzen anschlieSend - von Teilen der 
DSB-Erkennungsseguenz flankiert (nDS) , die den in Folge eines 
Schnittes mit dem DSBI-Enzym entstehenden Teilen, entsprechen 
(Fig. 6B, 6D) . Somit enth&lt die Insertionssequenz Sequenzen, 
die den in Folge eines Schnittes im Plastom entstehenden Enden 
10 unmittelbar entsprechenden und so einen besonders effizienten 
Einbau gew&hrleisten. 

Besitzt das Transf ormationskonstrukt bzw. die Insertionssequenz 
keine solche homologen Bereiche, wird die Insertionssequenz an 

15 diesen Enden bevorzugt mit tiberhangenden Enden versehen, die auch 
von dem DSBI-Enzym nach Schneiden des Plastoms der Masterpf lanze 
erzeugt wird (Fig. 6E) . Das Transf ormationskonstrukt kann zusatz- 
lich eine Sequenz kodierend f\ir ein DSBI-Enzym umfassen. Die 
Expression erfolgt jedoch erst nach erfolgreicher Insertion in 

20 das Plastom, so dass die Bereitstellung einer ersten Menge an 
funktioneller RNA Oder Protein eines DSBI-Enzyms wunschenswert 
ist. 

Liegt nur eine Homologiesequenz vor, so grenzt an diese in einer 
25 besonders bevorzugten Ausftihrungsform eine nDS-Sequenz (s.o. wie 
fiir Fig. 6B, 6D beschrieben) an, wahrend die andere Seite der 
Insertionssequenz mit tiberh&ngenden Enden versehen ist, die den 
vom DSBI-Enzym im Plastom der Masterpf lanze erzeugten entsprechen 
(nicht gezeigt) . 

30 

Die Insertion der Insertionssequenz des Transformations- 
konstruktes erfolgt dabei bevorzugt an einer Stelle derart, 
dass besagte Erkennungsregion nach der Insertion nicht mehr 
funktionell ist. 

35 

7. Fig.7A-E: Einftihrung einer Insertionssequenz umfassend eine 

Intronsequenz mit einer Kassette kodierend fur Gene 
von Interesse und ggf . Selektionsmarker bzw. DSBI- 
Enzyme 

40 

In einer weiteren, ganz besonders bevorzugten Ausftihrungsf orm 5 
ist das Gen von Interesse (sowie optional ein Selektionsmarker S' 
und/oder das DSBI-Enzym) innerhalb eines Introns kodiert, welches 
an der gewsihlten Insertionsstelle funktionell ist, d.h. aus dem 
45 dort gebildeten Transkript spleiSen kann. 
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Das erfindungsgem&Se Trans format ionskonstrukt besitzt bevorzugt 
beidseitig (Fig. 7A, 7B) oder einseitig (nicht gezeigt) der 
Insertionssequenz Bereiche, die homolog zu den Sequenzen umgebend 
die Insertionsstelle des DSBE-Konstruktes sind. Die Insertion 
5 erfolgt dann viber homologe Rekombination (z.B. Cross-Over) bzw. 
Reparatursyn these . 

Besitzt das Transformationskonstrukt bzw. die Insertionssequenz 
keine solche homologen Bereiche, wird die Insertionssequenz an 
10 diesen Enden bevorzugt mit tiberhelngenden Enden versehen, die auch 
von dem DSBI-Enzym nach Schneiden des Plastoms der Masterpf lanze 
erzeugt wird (nicht gezeigt) . 

Die Kontrolle der Expression kann mittels eines auf dem Trans - 
15 formationskonstrukt enthaltenen Promotors (Fig. 7B) oder einem 
enogenen, plastidSren Promotor realisiert werden (Fig. 7A) . Im 
ersten Fall ist das DSBI-Enzym bevorzugt auf dem Transformations- 
konstrukt enthalten (Fig. 7B), w&hrend es im letzteren Fall 
(zumindest parallel) entweder in trans exprimiert (in Plastiden 
20 oder als PLS-Fusionsprotein im Kern) bzw. in Form von RNA oder 
als Protein in die Plastiden transfiziert wird (Fig. 7A) . 

Die Insertion der Insertionssequenz des Transf ormations- 
konstruktes erfolgt dabei bevorzugt an einer Stelle derart, 

25 dass besagte Erkennungsregion nach der Insertion nicht mehr 
funktionell ist. Das Transformationskonstrukt kann zusatzlich 
optional eine Sequenz kodierend ftir ein DSBI-Enzym umfassen. Die 
Expression erfolgt jedoch erst nach erfolgreicher Insertion in 
das Plastom, so dass die Bereitstellung einer ersten Mengen an 

30 funktioneller RNA oder Protein eines DSBI-Enzyms wUnschenswert 
ist. 

8. Fig. 8: Deletion von Seuenzen mittels intramolekularer 

homologer Rekombination induziert durch sequenz- 
35 spezifische Doppelstrangbriiche 

Sequenzen - beispielsweise kodierend far Selektionsmarker bzw. 
DSBI-Enzyme - sind bei alien oben beschriebenen Ausftihrungs- 
formen bevorzugt von Homologiesequenzen Hi und H2 flankiert, die 

40 eine ausreichende Lange und Homologie aufweisen, urn miteinander 
zu rekombinieren. Die Rekombination wird durch die Induktion 
mindestens einen Doppelstrangbruches zwischen den beiden Homo- 
logiesequenzen gelegenen DSB-Erkennungssequenz induziert. Zur 
Induktion des Doppelstrangbruches wird bevorzugt ein DSBI-Enzym 

45 transient exprimiert oder eingebracht (Fig. 8) . 
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Dem Fachmann ist bewusst, dass die Reihenfolge der exprimierten 
Gene in einem Operon austauschbar ist und insofern in den 
oben beschriebenen Ausfuhrungsformen variieren kann. Auch 
kann bei Verwendung nur einer Homologiesequenz zu Insertion 
5 der Insertionssequenz diese an der 5'- (wie in den Abbildungen 
gezeigt) oder 3'-Seite des Doppelstrangbruches lokalisiert sein. 
Prinzipiell kann das DSBI-Enzym auf dem Trans format ionskonstrukt 
und/oder separat (im Kern oder Plastiden) exprimiert Oder anders- 
weitig - beispielsweise durch Transfektion mit RNA oder Protein 
10 in Plastiden - eingebracht werden. 

9. Fig. 9: Southern Analyse von uberwiegend homotransplastomen 

Pflanzen 

15 Wildtyp und Uberwiegend homotransplastome Masterpflanzen wurden 
bezuglich der Modifikation (Einftihrung einer DSB-Erkennungsse- 
quenz) anaylsiert (vgl. Beispiel 4). Durch die Modifikation wurde 
eine Bande von 1750 bp detektiert (Bahn 2 ,3, und 4 entsprechend 
den Linien CB199NTH-4, -6, und -8), wahrend in der nicht 

20 modifizierten Wildtyppf lanze eine Bande von 3100 bp detektiert 
wurde (Bahn 1) . 

10. Fig. 10: Modifizieren der IGS des Tetrahymena LSU Intron. 

25 GroSbuchstaben zeigen die Sequenz des Intron, w&hrend Kleinbuch- 
staben die Sequenz der umgebenden Exons darstellen. Gezeigt sind 
die f lankierenden Exonsequenzen, der 5 % - und 3'- Anteil des In- 
trons bzw. des Intronderivates sowie die Sequenz umfassend die 
IGS. Balken zwischen den Basen deuten mdgliche Basenpaarungen an, 

30 die zur Initiation des SpleiSvorganges ausgebildet werden konnen. 

A: Gezeigt sind die genannten Sequenzabschnitte des natttrlicher- 
weise vorkommenden Tetrahymena LSU Intron in seiner nattirli- 
chen Exon-Umgebung. 

35 

B: Gezeigt sind die genannten Sequenzabschnitte des im Rahmen 
dieser Erfindung erstellten Tetrahymena LSU Intron-Derivat 
(TetIVS2a) in der vordef inierten Exonumgebung , wie sie beim 
CpLSUS Intron innerhalb der DSB-Erkennungssequenz des DSBI- 
40 Enzyms I-Cpal zu finden ist. Fettgedruckte Buchstaben repra- 

sentieren die im Vergleich zur natiirlichen Sequenz vorgenom- 
menen Mutationen. 



45 
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A: Southern Analyse mit von mit BamHI geschnittener Gesamt-DNA 
aus den Tabaklinien CB255+435NTH-16b, -16c, -19 und -20. Als 
5 Sonde wurde ein Bereich der 16SrDNA genutzt. Die Banden, wel- 

che Plastomkopien represent ieren, die dem Wildtyp (WT) ent- 
sprechen (ca. 3,2 kb Bande detektiert) und die das Transgen 
tragen (TG) (ca. 2,3 kb Bande detektiert) sind durch Pfeile 
gekennzeichnet . 

10 

B: Schematsiche Dartsellung von transplastomen Tabakpf lanzen, 
die durch die Insertion der Insertionssequenz aus pCB435-45 
entstanden sind; sowie die bei einer entsprechenden Southern- 
Analyse (vgl. A) zu erwartenden Banden. 

15 

C: Southern Analyse mit von mit Hindlll geschnittener Gesamt-DNA 
aus den Tabaklinien CB255+435NTH-16b, -16c, -19 und -20. Als 
Sonde wurde ein Bereich der 23SrDNA genutzt. Die Banden, wel- 
che Plastomkopien repr&sentieren, die dem Wildtyp (WT) ent- 
20 sprechen (ca. 1,1 kb Bande detektiert) und die das Transgen 

(TG) tragen (ca. 1,5 kb Bande detektiert) sind durch Pfeile 
gekennzeichnet . 



D: Schematsiche Dartsellung von transplastomen Tabakpf lanzen, 
25 die durch die Insertion der Insertionssequenz aus pCB255-l 

entstanden sind; sowie die bei einer entsprechenden Southern- 
Analyse (vgl. C) zu erwartenden Banden. 



12. Fig. 12: 

30 

A: Wildtyp und uberwiegend homotransplastome Mas terpf lanzen wur- 
den bezuglich der Modifikation (Einfuhrung einer der I-Ppol 
DSB-Erkennungssequenz ) in einem Southern analysiert (vgl. 
Beispiel 14.2). Durch die Modifikation wurde in der hier mit 

35 EcoRI behandelten DNA eine Bande von etwa 1,7 kb detektiert 

(TG) (Bahn 1 und 4 entsprechend den Linien CB456NTH-1 und 
-15), w&hrend in der nicht modif izierten Wildtyppflanze (WT) 
eine Bande von etwa 3,1 kb detektiert wurde (Bahn 6) . (wt - 
nicht modif izierte Wildtyppflanze; wildtype - zeigt die er- 

40 wartete Fragmentgr8Se in nicht modifizierte Wildtyppf lanzen 

an; transgenic - zeigt die erwartete FragmentgrSSe in Pflan- 
zen CB456NTH an) 



B: Schematische Darstellung des EcoRI Fragments, welches in A 
45 durch die Hybridisierung mit der Sonde (probe) in einer modi- 

f izierten Pflanze CB456NTH zu erwarten war. (trnV - Gen co- 
dierend fur eine tRNA-Val; rrnl6 - Gen codierend fur die 
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16SrRNA; aadA - Gen codierend fiir einen Selektionsmarker; 
3 % psbA (Synec) - nicht kodierender Bereich stromabwarts des 
psbA-1 Gens aus SynechocystiS/ hier eingebaut in die Expres- 
sionskassette ftir den Selektionsmarker aadA; Psynth. - syn- 
5 thetischer Promotor abgeleitet von der Konsensussequenz fur 

E. coli a70 Promotoren; DSB-E: DSB-Erkennungssequenz ) . 

Beispiele 

10 Allgemeine Methoden: 

Die chemische Synthese von Oligonukleotiden kann beispielsweise, 
in bekannter Weise, nach der Phosphoamiditmethode (Voet, Voet, 
2. Auflage, Wiley Press New York, Seite 896-897) erfolgen. Die 

15 im Rahmen der vorliegenden Erfindung durchgeftthrten Klonierungs- 
schritte wie z.B. Restriktionsspaltungen, Agorosegelelektro- 
phorese, Reinigung von DNA-Fragmenten, Transfer von Nuklein- 
sauren auf Nitrozellulose und Nylonmembranen, Verkniipfen von 
DNA-Fragmenten, Transformation von E. coli Zellen, Anzucht von 

20 Bakterien, Vermehrung von Phagen und Sequenzanalyse rekombinanter 
DNA werden wie bei Sambrook et al. (1989) Cold Spring Harbor 
Laboratory Press; ISBN 0-87969-309-6 beschrieben durchgeftthrt . 
Die Sequenzierung rekombinanter DNA-Molekttle erfolgt mit einem 
Laser f luoreszenz-DNA-Sequenzierer ALF-Express (Pharmacia, Upsala, 

25 Schweden) nach der Methode von Sanger (Sanger et al. (1977) Proc 
Natl Acad Sci USA 74:5463-5467).. 

Beispiel 1: Erstellen eines Basis Vektors fiir die Plastiden- 
transformation 

30 

Zunachst wurden aus dem Plastom der Tabak VarietSt SRI die ausge- 
wShlten Zielregionen mittels PCR kloniert. Die linke Zielregion 
wurde dabei mit den Primern pl9 und p20 amplif iziert . 

35 p!9: 5 ' -TAAGGCCCTCGGTAGCAACGG-3 ' (SEQ ID NO: 16) 

p20: 5 ' -GGGGTACCAAATCCAACTAG-3 ' (SEQ ID NO: 17) 

Zur Amplifikation der rechten Zielregion wurden die Primer p21 
40 und p22 verwendet, wobei durch letzteren Primer in den ampli- 
fizierten Teil der 16SrDNA zusatzlich zur SRI Resistenz (binding 
type marker) auch noch eine Spectinomycin-Resistenz eingebracht 
wurde. 

45 p21: 5 ' -GGAGCTCGCTCCCCCGCCGTCGTTC-3 ' (SEQ ID NO: 18) 



WO 03/054189 PCT/EP02/14302 

90 

p22: 5 ' -G ATGC ATGATGACTTGACGGC ATCCTC - 3 ' (SEQ ID NO: 19) 



Die beiden amplif izierten Regionen wurden in pBluescript bzw. 
pZeroBlunt kloniert und sequenziert. Die linke und rechte Ziel- 
5 regionen wurden anschlieSend in das Rtickgrat des pUC19 Vektors 
kloniert. Dazu wurden die Schnittstellen Eco0109l und PvuII des 
Vektors genutzt. Zwischen die linke und rechte Zielregion wurde 
eine multiple Klonierungsstelle aus dem pBluescript (von Kpnl 
bis SacI) kloniert. Diese befindet sich im Basisvektor fur die 
10 Plastidentransformation zwischen den beiden plastidar kodierten 
Genen trnV und rrnl6. Dieser Basisvektor ftir die Plastiden- 
transformation erhielt die Bezeichnung pCB42-94 (SEQ ID NO: 1) . 
Der Vektor enth&lt nachfolgende Sequenzelemente : 

15 a) Position komplementelr bp 55-1405: Rechte Zielregion mit dem 
partiellen Gen der 16SrRNA (komplemeritar bp 56 bis 1322) . 
In letzterem sind Mutationen ftir die Streptomycin-Resistenz 
(SRI, Position bp 346) und Spectinomycin-Resistenz (SPC1, 
Position bp 68) . 

20 b) Position komplementlr bp 2374 bis 1510: Linke Zielregion 
umfassend u.a. 0RF131 (bp 1729 bis 2124) und trnV Gen 
(komplementar bp 1613 bis 1542). 

c) Position bp 1404 bis 1511: multiple Klonierungsstelle 

25 

d) Position bp 2629 bis 3417: Ampicilin Resistenz im Vektor- 
rtickgrat 

Beispiel 2: Erstellen eines Vektors (pCB199-3) ftir die Ein- 
30 bringung einer nicht nattirlicherweise vorkommenden 

Erkennungsregion ftir die Homing Endonukleasen I-Ppol 
in das Plastom von Tabak 

In die multiple Klonierungsstelle des Basisvektors pCB42-94 
35 (SEQ ID NO: 1) ftir die Plastidentransformation wurden sukzessive 
verschiedene Elemente kloniert: 

a) frt Erkennungsregion (mutiert, enthait keine Xbal Schnitt- 
stelle; komplementar 1307-1354) 

40 

b) Expressionskassette zur Expression des Markergens aadA 
bestehend aus: 

i) Promotor des Gens ftir 16SrRNA (komplementSr 1191-1281) 

45 
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ii) 5' untranslatierte Bereich des Tabak rbcL Gens (komple- 
mentar 1167-1184) einschlieSlich mutierter 5' Anteilen 
des rbcL Gens (Duplikation von 6 AS des rbcL Gens, teil- 
weise mutiert, als Folge der Klonierungsstrategie, so 

5 dass eine Fusion codierend fttr insgesamt 12 Aminosauren 

(komplementSr 1131-1166) mit dem nachf olgendem Element, 
dem aadA Gen, ent stand) 

iii) aadA Gen (komplement&r 336-1130) 

iv) der 3' Bereich des pshA Gens (komplementar 232-323) 



c) Core-Erkennungsregion fiir die Homing Endonuklease I-Ppol 
(komplementar 176-190) . 

15 

Anstelle der multiplen Klonierungsstelle im Basisvektor f\ir die 
Plastidentransformation enthait dieser Vektor mit der Bezeichnung 
PCB199-3 die aufgeftihrten Elemente im Rahmen der NukleinsSure- 
sequenz mit der SEQ ID NO: 2. Angegeben ist die Sequenz, die 
20 die komplette MCS von Kpnl bis Sad ersetzt. In der angegebenen 
Sequenz gibt es aufgrund der Klonierungsstrategie jedoch keine 
Kpnl Schnittstelle mehr. 

Beispiel 3: Erstellen eines weiteren Vektors (pCB401-20) fttr die 
25 Einbringung einer nicht natiirlicherweise vorkommende 

Erkennungsregion far die Homing Endonukleasen I-Ppol 
in das Plastom von Tabak 



Im Gegensatz zu dem in Beispiel 2 beschriebenen Vektor pCB199-3 
30 enth&lt der hier beschriebene Vektor keinen Promotor und 3'UTR, 
der direkt mit dem Selektionsmarker aadA verknupft wurde, 
Vielmehr wird die Expression des aadA Gens ausgehend von dem 
Promotor des trnV Gens, welches im Plastidengenom bzw. in der 
linken Zielregion stromauf warts des aadA Gens lokalisiert ist, 
35 gesteuert. Ziel bei der Erstellung dieses Vektors war es, 
Sequenzduplikationen durch das Ausnutzen von regulatorischen 
Bereichen aus dem Tabakplastidengenom zu vermeiden. Dazu wurden 
in die multiple Klonierungsstelle des Basisvektors pCB42-94 fur 
die Plastidentransformation sukzessive verschiedene Elemente 
40 kloniert: 



a) Ribosomenbindestelle (komplementar bp 1033 bis 1050) 



b) aadA Gen (komplementar bp 238 bis 1032) 

45 
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c) Core-Erkennungsregion fttr die Homing Endonukleasen I-Ppol 
(komplementar bp 176 bisl90) 

Der so erhaltene Vektor vermittelt auch in E. coli eine Spectino- 
5 mycin Resistenz. Anstelle der multiplen Klonierungsstelle im 
Basisvektor pCB42-94 (SEQ ID NO: 1) ftir die Plastidentrans- 
formation enthcLlt dieser Vektor mit der Bezeichnung pCB4 01-20 
die aufgeftihrten Elemente iin Rahmen der Nukleinsauresequenz mit 
der SEQ ID NO: 3. Auch hier ist die gesamte die MCS ersetzende 
10 Seguenz (von Sac I bis Kpnl) angegeben. 

Beispiel 4: Erstellen von uberwiegend homoplastomischen Tabak 
Masterpflanzen, die eine nicht natiirliche DSB- 
Erkennungssequenz enthalten 

15 

Das Plasmid pCB199-3 wurde in die Plastiden von Tabak {Nicotiana 
tabacxim cv. Petit Havana) wie im folgenden beschrieben ein- 
gebracht. Die regenerierten Pflanzen wurden CB199NTH genannt. 
UnabhSngige Linien wurden mit verschiedenen Endnummern (z.B. 
20 CB199NTH-4) versehen. 

Analog wird der Vektor pCB401-20 in die Plastiden von Tabak 
eingebracht. Die resultierenden Pflanzen werden entsprechend 
mit CB401NTH bezeichnet. 

25 

Zunachst wurden von in vitro gewachsenen Pflanzen mit einem 
sterilen Korkbohrer Blattscheibchen mit einem Durchmesser von 
2,0 bis 2,5 cm ausgestochen und je mit der Blattoberseite auf 
eine Petrischale mit Beschussmedium [MS-Salze (Sigma-Aldrich) : 

30 4,3 g/L; Saccharose: 30,0 g/L, Phytoagar (Duchefa, P1003): 0,6 % 

» (w/v) ; pH 5,8; nach dem Autoklavieren wurden 1,0 mg/L Thiamin 

(Duchefa, T0614) und 0,1 g/L myo-Innositol (Duchefa, 10609) zuge- 
geben] platziert. Die vom Agar abgewandte Blattunterseite wurde 
mittels der Partikelkanone anschliefiend beschossen, Dazu wurde 

35 zunSchst die zu trans formierende Plasmid-DNA (aus E. coli 
gereinigt mittels Nucleobond AX100 Macherey & Nagel) nach 
folgendem Protokoll auf 0,6 pm groEe Goldpartikel aufgebracht 
( "Coating* ) . ZunSchst wurden 30 mg Goldpulver (BioRad) in Ethanol 
auf genommen . 60 fil von der Goldsuspension wurden in ein neues 

40 EppendorfgefaS tiberfiihrt und die Goldpartikel durch Zentri- 

fugation (fur 10 Sekunden) sedimentiert . Die Goldpartikel wurden 
zweimal in je 200 |ll sterilem Wasser gewaschen und nach einem 
weiteren Zentrifugationsschritt in 55 \il Wasser aufgenommen. 
Unter standigem Mischen (Vortexen) wurden schnell hinzugegeben: 

45 

5 \il Plasmid-DNA (1 |ig/^l) 
50 |il 2,5 M CaCl 2 
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20 jxl 0/1 M Spermidine 

Die Suspension wurde sodann ftir weitere 3 Minuten auf dem Vortex 
gemischt und anschliefcend kurz anzentrifugiert . Die sedimentier- 
5 ten Gold-DNA-Komplexe wurden ein- bis zweimal in je 200 nl Ethan- 
ol gewaschen und nach einem weiteren Zentrifugationsschritt 
schlieSlich in 63 \il Ethanol auf genommen . Pro Schuss wurden 3,5 Jil 
(entsprechend 100 \ig Gold) dieser Suspension auf einen Macro* 
carrier aufgebracht. 

10 

GemaS den Herstellerangaben wurde die Partikelkanone (BioRad, 
PDSlOOOHe) vorbereitet und die Blattexplantate in einem 
Abstand von 10 cm mit den Gold-DNA-Komplexen beschossen. Dabei 
wurden folgende Parameter verwendet: Vakuum: 27 inch Hg, Druck 

15 1100 psi. Die Explantate werden nach dem Beschuss ftir 2 Tage 

in Klimakammern (24°C, 16 h Licht, 8 h Dunkelheit) inkubiert und 
anschliefcend mit einem Skalpell in etwa 0,5 cm2 gro&e Segmente 
zerteilt. Diese Segmente wurden dann auf Regenerationsmedium [Be- 
schussmedium zuzuglich 1 mg/L 6-Benzylaminopurin (BAP, Duchefa, 

20 B0904) und 0,1 mg/L Naphthylessigsaure (NAA, Duchefa, N0903)] zu- 
zuglich 500 mg/L Spectinomycin (Duchefa, S0188) viberfiihrt und far 
10 bis 14 Tage unter oben genannten Bedingungen in einer Klima- 
kammer inkubiert. Nach Ablauf dieser Zeit wurden die Blattseg- 
mente auf frisches Regenerationsmedium zuzttglich 500 mg/L Specti- 

25 nomycin tiberfuhrt. Dieser Vorgang wurde so lange wiederholt, bis 
sich grtine Sprosse an den Explantaten bildeten. Die Sprosse wur- 
den mit einem Skalpel abgetrennt und auf Anzuchtmedium {wie Be- 
schussmedium, jedoch 10 g/L Saccharose anstelle von 30 g/L 
Saccharose) zuzttglich 500 mg/L Spectinomycin angezogen. 

30 

Optional konnen, um m5glichst \iberwiegend homoplastome Pflanzen 
zu erhalten, von den regenerierten Pflanzen wiederum Explantate 
abgeschnitten und auf Regenerationsmedium mit 1000 mg/L Spectino- 
mycin gelegt werden. Regenerierende Sprosse werden in Glaser mit 
35 Anzuchtmedium zuzUglich 500 bis 1000 mg/L Spectinomycin gesetzt. 
Nach dem Bewurzeln werden die Pflanzen ins GewSchshaus transfe- 
riert und dort auf Erde bis zur Samenreife herangezogen. 

Im Fall der Transformation mit dem Plasmid pCB199-3 wurden 
40 8 Pflanzen erhalten, die Resistenz gegenOber Spectinomycin 

zeigten. Mittels PCR und Southern-Analysen wurde nachgewiesen, 
dass drei dieser Linien (Linien CB199NTH-4, -6 und -8) auch 
tatsfichlich das aadA Gen in das Plastidengenom eingebaut haben. 

45 Zur Analyse der transplastomen Pflanzen nach Southern wurde 

Gesamt-DNA aus Biattern von transf ormierten und nicht transfor- 
mierten Pflanzen mit Hilfe des GenElute Plant Genomic DNA Kit 
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(Sigma) isoliert. Die DNA wurde dabei in 200 Jll Eluat auf- 
genommen. 86 \il davon wurden je mit 10 Jil lOx Restriktionspuf fer 
sowie 40 U Restriktionsendonuklease versetzt und 4 bis 8 h bei 
der fur das Restriktionsenzym empfohlenen Temperatur inkubiert. 
5 AnschlieSend wurde die DNA in dem Fachmann bekannter Weise mit 
Ethanol prSzipitiert und anschliefcend in 20 \il Wasser auf- 
genommen. Die Proben wurden anschlieSend gem&fc dem Fachmann 
bekannten Verfahren auf einem Agarosegel aufgetrennt, die DNA 
in dem Gel denaturiert und mittels Kapillarblot auf Nylonmembran 
10 ubertragen. 

Eine entsprechende Sonde fur die radioaktive Hybridisierung wurde 
mit Hilfe des HighPrime (Roche) Systems erstellt. Die Membran 
wurde zunachst 1 h bei 65°C mit HybPuffer (1 % (w/v) ) Rinder- 

15 seumalbumin; 7 % (w/v) SDS; 1 mM EDTA; 0,5 M Natriuraphosphat- 
Puffer, pH 7,2) vorhybridisiert. Anschliefcend wurde die hitze- 
denaturierte Sonde hinzugegeben, und es wurde uber Nacht bei 
65°C hybridisiert. Die Blots wurden anschliefiend wie folgt 
gewaschen: einmal Spttlen mit 2 x SSPE/0,1 % SDS; fur 15 min. 

20 bei 65°C waschen mit 2 x SSPE/0,1 % SDS; ftir 15 min. bei 65°C 
waschen mit 1 x SSPE/0,1 % SDS und ggf . wurde der letzte Schritt 
noch einmal wiederholt (20 x SSPE ist 3 M NaCl; 0,2 M NaH2P04; 
0,5 M EDTA; pH 7,4) . 

25 Die Hybridisierung wurde anschlieSend mit Hilfe eines Phospho- 
imagers (Molecular Imager FX, BioRad) analysiert. 

Beispielsweise wurde mit PstI geschnittene Gesamt-DNA ver- 
schiedener Pflanzen, die nach der Transformation mit pCB199-3 

30 regeneriert wurden, mit dem aadA Gen als radioaktiv markierte 

Sonde (793bp PstI\NcoI Fragment aus pCB199-3) hybridisiert, Dabei 
konnte festgestellt werden, dass die Linien CB199NTH-4, -6 und 
-8 tatsclchlich das aadA Gen in die DNA eingebaut hatten. Des 
weiteren wurde mit EcoRI und Xhol geschnittene gesamt DNA von 

35 CB199NTH-4, -6 und -8 mit einer radioaktiv markierten Sonde 

(1082 bp Bspl20I/SacI Fragment aus pCB199-3) hybridisiert, welche 
mit einem Teil der 16S rDNA hybridisiert. wahrend im Wildtyp 
(nicht transformierte Pflanze) erwartungsgemSfi eine Bande von 
etwa 3100 bp nachgewiesen wurde, wurde in den transplastomen Li- 

40 nien uberwiegend eine Bande bei 1750 bp detektiert, die sich auf- 
grund der Insertion der Insertions sequenz aus pCBl99-3 in das 
Plastom ergibt (Fig. 9). Die erhaltenen Pflanzen k6nnen als Uber- 
wiegend homotransplastom verstanden werden. 



45 
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Beispiel 5: Erstellen von Transformationsvektoren, die zur Trans- 
formation der Plastiden von Masterpflanzen CB199NTH 
mittels des artif iziellen Homing-Prozesses genutzt 
werden k6nnen 

5 

5.1 Klonieren der Homing Endonuklease I-Ppol 

Die Homing Endonuklease I-Ppol wurde aus 26 synthetisch 
erstellten Oliogonukleotiden mittels PCR in Anlehnung an die 

10 Methode von Stemmer WPC et al. (1995) Gene 164: 49-53 erstellt 
(SEQ ID NO; 11) . Die zugrunde liegende Sequenz wurde von der 
verof fentlichten Sequenz abgeleitet (Accession No. M38131 
Nukleotide 86 bis 577) . Dabei wurden einige Mutationen ein- 
gefuhrt, urn Erkennungsstellen fur Restriktionsendonukleasen aus 

15 dem Gen zu entfernen, von denen aber keine eine verSnderte Amino- 
s§uresequenz bedingt. AnschlieEend wurden sukzessiv folgende 
Elemente in einem pBluescript KS (Stratagene) VektorrCickgrat 
vereint, um eine I-Ppol Expressionskassette zu erstellen. Die 
Sequenz ist von den Schnittstellen Kpnl und Sad flankiert. 

20 

a) Position 21 bis 111: Prrn Promotor 

b) Position 118 bis 135: 5'-untranslatierte Region des rbcL 
Gens gefolgt von 18 bp kodierend fiir 6 Aminosauren des 

25 rbcL-Protein (bp 136-152) 

c) Position 154 bis 645: Nukleinsauresequenz kodierend fttr 
I-Ppol. 

30 d) Position 688-779: 3 ' -untranslatierte Region des psbA-Gens. 

Das resultierende Plasmid wurde mit pCB289-13 bezeichnet. Trotz 
der in E, coli zu erwartenden Expression des Enzyms I-Ppol wurden 
keine BeeintrSchtigungen des Wachstums festgestellt . Von der 
35 Kpnl bis zur Sad Schnittstelle ergab sich durch SEQ ID NO: 4 
beschriebene Sequenz (Vektorrtickgrat ist unverandert das des 
pBluescript KS) . 

5.2 Erstellen eines Transformationsvektors ftir artif izielles 
40 Homing mit beidseitig die Insertionssequenz flankierende 

homologe Regionen 

I) ohne I-Ppol in der Insertionssequenz 

45 Bereiche um die I-Ppol Erkennungsregion aus pCBl99-3 wurden mit 
PstI und SacI ausgeschnitten und in die PstI und Sad Schnitt- 
stellen des pBluescript legiert. Anschliefcend wurden aus diesem 
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Vektor nicht benotigte Schnittstellen entfernt, indem er mit PstI 
und Bspl20I linearisiert wurde und nach einer Behandlung mit 
dem Klenow-Fragment der Vektor wieder rezirkularisiert wurde. 
Mit Hilfe kommerziell verftigbarem Enzym I-Ppol (PROMEGA GmbH, 
5 Mannheim, Deutschland) wurde in dem erhaltenen Vektor die ent- 
sprechende Erkennungsregion geschnitten und dort hinein mittels 
der synthetischen Oligos pl90 und pl91 weitere Schnittstellen 
eingebracht . 



10 Oligo p!90: 5 ' -GTCGACAGATCTTTAA-3 ' {SEQ ID NO: 20) 



Oligo p!91: 5 ' -AGATCTGTCGACTTAA-3 ' (SEQ ID NO: 21) 



In die so eingebrachten Schnittstellen Sail und Bglll wurde eine 
15 Expressionskassette als Bglll / xhol Fragment (SEQ ID NO: 6) 
bestehend aus folgenden Elementen eingebracht: 

a) Prpsl6 Promotor (komplementar 1033-1139) 

20 b) 5'rbcL (komplementar 1007-1024) rait 18 bp codierend ftir die 
6 AS (komplementar 989-1006) 



c) nptll Gen (komplementar 185-988) 



25 d) 3'rbcL (komplementar 6-143) 

Der resultierende Vektor wurde mit pCB304-25 bezeichnet und ver- 
lieh auch E. coli Zellen Kanamycin Resistenz. Dieser Vektor wird 
durch kommerziell verfugbares I-Ppol nicht mehr linearisiert. Das 
30 gesamte Insert des Vektors pCB3 04-25 (Grundgertlst pBluescr ipt ,- 
von SacI bis Kpnl entsprechend die MCS ersetzend) ist durch 
SEQ ID NO: 62 beschrieben und umfasst somit folgende Elemente: 

a) Position bp 19 bis 110: 3'pshA aus Tabak 

b) Position bp 149 bis 160: nicht funktionelle "Halbseite" 

der I-Ppol Erkennungssequenz 



c) Position bp 171 bis 277: Prpsl6 Promotor 



40 



d) Position bp 286 bis 303: 



45 



5'rbcL Sequenz gefolgt von 18bp 
kodierend fiir die ersten 6 Amino 
sSuren des von rbcL Proteins 
(bp 304-321) 



e) Position bp 322 bis 1125: nptll 
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f) Position bp 1167 bisl304: 3'rbcL 
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g) Position bp 1310 bis 1319: nicht funktionelle "Halbseite" 

der I-Ppol Erkennungssequenz 

5 

II) Mit I-Ppol in der Insertionsseguenz. 

Mit Hilfe der BamHI und EcoRI Schnittstellen wurde in den 
Vektor pCB304-25 zusStzlich ein Bglll / Muni Fragment ein- 
10 gebracht, welches fttr eine 5'psbA - I-Ppol Fusion kodierte. 
Der entstandene Vektor pCB320-192 exprimierte unter Kontrolle 
des Prpsl6 Promotor also das nptll Gen und die I-Ppol Homing 
Endonuklease . Das Bgl II / Mun I Fragment ist durch SEQ ID NO: 63 
wiedergegeben und umfasst folgende Elemente: 

15 

a) Position bp 6 bis 82: 5'psbA 

b) Position bp 83 bis 574: I-Ppol 

20 5.3 Erstellen eines Trans formationsvekt or s fttr artif izielles 

Homing mit einer einseitig die Insertionssequenz flankieren- 
den homologen Region 

Aus dem Vektor pCB320-192 wurden durch Restriktion mit Kpnl und 
25 Bglll die stromaufw&rts des Prpsl6 Promotor gelegenen Elemente, 
die homolog zu denen in den Masterpf lanzen CB199NTH sind, ent- 
fernt. An deren Stelle wurde mittels synthetischer Oligonukleo- 
tide pl99 und p200 eine BstXI Schnittstelle dort eingebracht. 

30 p!99 5 ' -GATCTCCAGTTAACTGGGGTAC-3 ' (SEQ ID NO: 22) 

p200 5 ' -CCCAGTTAACTGGA-3 ' (SEQ ID NO: 23) 

Durch Schneiden mit BstXI kann man nun DNA-Enden erzeugen, 
35 die kompatibel zu denen sind, die durch Restriktion mit I-Ppol 

entstehen. Der erhaltene Vektor wurde mit pCB322-l bezeichnet. 

Beispielsweise mit den Enzymen BstXI und SacI kann aus diesem 

Vektor ein Fragment gewonnen werden, welches an der einen Seite 

ein zu DNA, die mit I-Ppol an seiner Core-Erkennungsregion 
40 geschnitten wurde, kompatibles Ende und an der anderen Seite 

Homologie zu Plastomseguenzen der Masterpf lanzen CB199NTH 

besitzt. 



45 
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5.4 Erstellen eines Transf ormationsvektors fiir artif izielles 

Homing ohne homologe Bereiche um die Insertionssequenz herum 

Aus dem Vektor pCB322-l wurde mit SacI und BspTI der verbliebende 
5 Teil, der homolog zu rekombinanten Plastidensequenzen der Master- 
pflanzen CB199NTH ist, entfernt. Gleichzeitig wurde durch ein- 
bringen synthetischer Oligonukleotide p218 und p219 hier eine 
BstXI Schnittstelle erzeugt, die nach Schneiden mit BstXI DNA- 
Enden generiert, welche kompatibel zu mit I-Ppol geschnittener 
10 DNA sind. Der resultierende Vektor wurde mit pCB347-33 gekenn- 
zeichnet . 

p218 5 ' -TTAAGCCAGTTAACTGGGCGGAGCT-3 ' (SEQ ID NO: 24) 

15 p219 5 ' -CCGCCCAGTTAACTGGC-3 ' (SEQ ID NO: 25) 

Mit dem Enzym BstXI kann aus diesem Vektor ein Fragment isoliert 
werden, welches auf beiden Seiten DNA-Enden aufweist, welche 
kompatibel zu den DNA-Enden sind, die das I-Ppol Enzym an seiner 
20 Core-Erkennungsregion erzeugt. 

Beispiel 6: Ausnutzen der Masterpf lanzen CB199NTH ftir eine 
Plastidentransformation mittels DSB-Induktion 

25 6.1 Nutzen der unter 5.1 und 5.2 erstellten Vektoren zur Trans- 
formation der Masterpflanzen CB199NTH durch Ausnutzen des 
DSBI -Enzymes I-Ppol 

Das Plasmid pCB3 04-24 wurde gleichzeitig mit dem Plasmid 
30 pCB289-13 wie unter Beispiel 4 beschrieben auf Goldpartikel 
aufgebracht und in entsprechend den Ausftihrungen in Beispiel 4 
behandelte Explantate der Masterpflanzen CB199NTH geschossen. In 
Abweichung zu den Beschreibungen in Beispiel 4 erfolgt zunachst 
eine Inkubation fxir 10 Tage auf dem Regenerationsmedium ohne 
35 Antibiotikum, spSter wird Kanamycin in einer Konzentration von 
50 mg/L verwendet (im Gegensatz zu den in Beispiel 4 angegebenen 
500 mg/L Spectinomycin) . 

Das Plasmid pCB320-192 wurde wie unter Beispiel 4 beschrieben auf 
40 Goldpartikel aufgebracht. Nach dem Waschen mit Ethanol wurden 
noch 20 U kommerziell verftigbarem I-Ppol Enzym (Promega) hinzu- 
gegeben. Die weitere Behandlung erfolgt wie oben beschrieben. 

Ferner wurde in einem anderen Ansatz 0,5 |ig eines mit Hilfe 
45 der T7-Polymerase in vitro erstellten Transkriptes gleichzeitig 
mit dem Plasmid pCB320-192 auf die Goldpartikel aufgebracht. 
Als Matrize fur die in vitro Transkription diente mit Hindlll 
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linearisierte DNA des Plasmides pCB289-13. Das so erstellte 
Transkript codiert also far I-Ppol. Nach dem Beschuss werden 
die Explantate der Masterpf lanzen wie oben beschrieben weiter 
behandelt . 

5 

6.2 Nutzen der unter 5.1 und 5.3 erstellten Vektoren zur Trans- 
formation der Masterpflanzen CB199NTH durch Ausnutzen des 
DSBI-Enzymes I-Ppol und nur einseitig vorhandener homologer 
Regionen 

10 

Ein mit BstXI und Sad aus dem Plasmid pCB322-l ausgeschnittenes 
Fragment wurde aus einem Agarosegel eluiert. Dieses Fragment 
wurde anschlieSend gleichzeitig mit 1 jig in vitro Transkript von 
mit Hindlll linearisierten Plasmid pCB289-13 (vgl. Beispiel 6.1) 
15 auf Goldpartikel gebracht. Nach dem Beschuss der Explantate der 
Masterpflanzen CB199NTH wird die weitere Behandlung wie unter 
Beispiel 6.1 beschrieben vorgenommen. 

6.3 Nutzen der unter 5.1 und 5.4 erstellten Vektoren zur Trans- 
20 formation der Masterpflanzen CB199NTH durch Ausnutzen des 

DSBI-Enzymes I-Ppol ohne homologe Regionen 

Aus dem Plasmid pCB347-33 wurde mittels BstXI die Insertions- 
sequenz ausgeschnitten und aus einem Agarosegel eluiert. Dieses 
25 Fragment wurde gleichzeitig mit 1 \ig in vitro Transkript des mit 
Hindlll linearisierten Plasmides pCB289-13 auf Goldpartikel auf- 
gebracht. Beschuss und nachfolgende Behandlung erfolgt wie unter 
Beispiel 6.1 ausgeftthrt. 

30 Beispiel 7: Identif izieren von natiirlich vorkommenden, endo- 
genen Erkennungsregionen ftir Homing Endonukleasen 
in Plastomen verschiedener Pf lanzenspezies 

Obwohl in den Plastiden hoherer Pflanzen keine Homing Endo- 
35 nukleasen bekannt sind, wurden bekannte Plastomsequenzen auf das 
Vorhandensein von Erkennungsregionen fur Homing Endonukleasen hin 
untersucht. Dies erfolgte mit Hilfe des Computerprogramms SeqMan 
II { DNASTAR Inc.). Die Erkennungsregionen, die auf diese Weise 
identif iziert wurden, sind in Tabelle 1 zusammengefasst . 

40 

Es war aufgrund der Computeranalyse nicht moglich, zu ent- 
scheiden, ob I-Scel im Plastidengenom eine Erkennungsregion 
besitzt oder nicht. Die Region, die mit hdchster Wahrschein- 
lichkeit als Erkennungsregion f\ingieren kann, wurde synthetisch 
45 erstellt und als Oligonukleotide p276 und p277 in die Xbal und 
Xhol Schnittstelle des pBluescript integriert. Das resultierende 
Plasmid pCB414-l wurde anschlieSend mit Hilfe komerziell ver- 
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fiigbarem Enzym I-Scel (Roche) auf das Vorhandensein einer 
fxankti one lien Schnittstelle hin analysiert. Tatsachlich wurde 
das Plasmid durch I-Scel linearisiert . Daraus kann gefolgert 
werden, dass in Plastiden exprimiertes I-Scel ebenfalls diese 
5 Sequenz erkennt und schneidet. Damit ist eine weitere endogene 
DSB-Erkennungssequenz fiir ein DSBI -Enzym identif iziert worden. 

p276 5 ' -TCGAGAAGATCAGCCTGTTATCCCTAGAGTAACT-3 ' (SEQ ID NO: 26) 

10 p277 5 ' -CTAGAGTTACTCTAGGGATAACAGGCTGATCTTC-3 ' (SEQ ID NO: 27) 

Beispiel 8: Klonieren von homologen Bereichen aus dem Tabak- 
plastom, die die endogene Erkennungsregion far 
die Homing Endonuklease I-Cpal flankieren 

15 

Stromauf- und stromabwarts der I-Cpal Erkennungsregion wurden 
DNA-Fragmente aus der 23S rDNA des Tabakplastom mittels PCR unter 
Verwendung der Primer p93 und p97 bzw. p98 und p95 amplif iziert . 

20 p93: AAAGATCTCCTCACAAAGGGGGTCG (SEQ ID NO: 64) 

p97: TCGAAGACTTAGGACCGTTATAG (SEQ ID NO: 65) 

p98: AGGAAGACCTTGTCGGGTAAGTTCCG (SEQ ID NO: 66) 

25 

p95: CTCAATTGGGGTCTCTCTGTCCAGGTGCAGG (SEQ ID NO: 67) 

Die so erhaltenen Fragmente wurde zur Konstruktion des Vektors 
PCB270-1 verwendet. Angegeben ist das Fragment von BssHII bis 
30 BssHII des pBlueScript Vektors (SEQ ID NO: 8), wobei das ange- 
gebene 5' Ende der Sequenz an der BssHII Schnittstelle zu finden 
ist, die naher am 3' Ende des lacZ Genes liegt. 

Zwischen den stromauf- und stromabw&rts der I-Cpal Erkennungs- 
35 regionen gelegenen DNA Fragmenten wurden zwei Bpil Schnittstellen 
eingefiihrt. Bpil erzeugt ttberhangende Enden, die aufierhalb ihrer 
Erkennungsregion liegen. Durch dieses Vorgehen konnte gew^hr- 
leistet werden, dass der Vektor pCB270-l fttr die nachfolgende 
Integration verschiedener Introns gleichermafien genutzt werden 
40 kann. Dazu werden an den zu klonierenden Introns einfach Uber- 
hangende Enden erzeugt, die kompatibel zu den durch Bpil erzeug- 
ten Enden im Vektor pCB270-l sind. Ferner addiert man an die 
Introns die entsprechenden Nukleotide, die zwischen den beiden 
Fragmenten der 23S rDNA im Vektor pCB270-l fehlen. Die ausgewfihl- 
45 ten Bereiche sind so hoch konserviert, dass aus anderen Pflanzen- 
spezies keine neuen Regionen amplifiziert werden brauchen. Ferner 
ist in die stromabw&rts der I-Cpal Erkennungsregion gelegene 



WO 03/054189 PCT/EP02/14302 

101 

Sequenz ttber die PCR Strategie eine Punktmutation in die 23 S rDNA 
Fragment eingebaut worden, wie sie auch in Lincomycin resistenten 
Mutanten gefunden wurde. Die in den pBluescript Vektor inser- 
tierte Sequenz des Vektors pCB270-l ist unter der SEQ ID NO: 8 
5 wiedergegeben . Die Sequenz umfasst nachfolgende Elemente: 

Fragment der 23SrDNA stroraaufwarts der I-Cpal Erkennungs- 
region: Nukleotide 37 bis 194 

10 - Fragment der 23SrDNA stromaufwarts der I-Cpal Erkennungs- 
region: Nukleotide 237 bis 359 

Punktmutation fur Lincomycinresistenz : 352 (natiy ist hier A) 

15 Vektor pCB234-l ist genauso aufgebaut wie der Vektor pCB270-l, er 
besitzt lediglich stromabwarts der unten angegeben Sequenz noch 
je eine Erkennungsregion fur die Restriktionsendonukleasen Xhol 
und Sac I. 

20 Beispiel 9: Klonieren des CpLSU2 Intron einschliefclich der Homing 
Endonuklease I-Cpal 

Aus DNA der Alge Chlamydomonas pallidostigaratica (Sammlung von 
Algenkulturen Gottingen, Culture Collection of Algae at the 
25 University Gottingen, SAG Nummer 9.83, Chlamydomonas segnis, 
authentic strain of Chlamydomonas pallidostigmatica King) wurde 
mittels PCR mit den Oligonukleotiden p91 und p92 das CpLSU2 
Intron amplifiziert (SEQ ID NO: 15). 

30 p91 5 ' -AGAAGACGATCCTAAGG-3 ' (SEQ ID NO: 28) 

p92 5 ' -TGAAGACTTGAC AAGGAATTTCGC - 3 ' (SEQ ID NO: 29) 

Die Wahl der Oligonukleotide war derart, dass wie oben 
35 beschrieben eine Klonierung in die Bpil Schnittstellen des 

Vektors pCB234-l m6glich war. Die Sequenz umfasst nachfolgende 
Elemente : 

Position 9-17 - Anteil der Tabak 23S rDNA, der in pCB234-l 
40 fehlt 

CpLSU2 -Intron: Position 18-893 

I-Cpal ORF: Position 377-835 

45 
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- Anteil der Tabak 23S rDNA, der in pCB234-l 



Dieses Fragment, welches das CpLSU2 Intron umfasst, wurde in 
5 das Rttckgrat des Vektors pGEMTeasy (Promega) kloniert (Vektor 
pCB141-3) . Das gesamte Fragment wurde mit Bpil aus diesem 
Vektor ausgeschnitten und in den mit Bpil linearistierten 
Vektor pCB234-l kloniert. Der resultierende Vektor wurde mit 
mit pCB254-2 bezeichnet. 

10 

Beispiel 10: Nukleares LSU-rRNA Intron aus Tetrahymena thermophila 

10.1 Klonieren des nukleSren LSU-rRNA Intron aus Tetrahymena 
thermophila 

15 

Mittels PCR wurde aus dem Organismus Tetrahymena thermophila das 
LSU-rRNA Intron amplif iziert . Die Oligonukleotide pl02 und pl03 
wurden wieder derart gew&hlt, dass an das zu amplif izierende 
Intron die in pCB234-l fehlenden Nukleotide der Tabak 23S rDNA 
20 angefugt wurden. 

pl02 (SEQ ID NO: 30) : 

5 ' -AGAAGACGATCCTAAATACXIAATATTTACCTTT^ ' 

25 pl03 (SEQ ID NO: 31) : 

5 ' TGAAGACTTGACAAGGAATTTC GCTACCTTCGAGTACTC CAAAAC TAATC - 3 ' 

AuSerdem ist die internal guide sequence (Unterstrichen in 
pl02) durch die Wahl des Oligonukleotides p!02 derart gegentiber 

30 dem Wildtyp mutiert, dass ein SpleiSen dieses Introns an der 
gewiinschten Position in der 23SrDNA vom Tabak mSglich ist. Die 
unter SEQ ID NO: 7 angegebene Seguenz - angegeben ist das PCR 
Fragment von Bpil bis Bpil Schnittstelle - wurde in das Rtickgrat 
des Vektors pGEMTeasy kloniert. Der erhaltene Vektor wurde mit 

35 pCB220-17 bezeichnet. Die Seguenz umfasst nachfolgende Elemente: 

Position 9-12 - Anteil der Tabak 23S rDNA, der in pCB234-l 
fehlt 

40 - LSU- Intron: Position 13-425 

Position 426-446 - Anteil der Tabak 23S rDNA, der in pCB234-l 
fehlt 



45 Das Tetrahymena LSU- Intron wurde einschlieSlich der angefugten, 
flankierenden Sequenzen aus dem Vektor pCB220-17 mit Bpil aus- 
geschnitten und in die Bpil Schnittstellen des Vektors pCB234-l 



WO 03/054189 PCT/EP02/14302 

103 

insertiert. Das entstandene Produkt wurde mit pCB255-l bezeich- 
net. 

10.2 Indirekter Nachweis der Spleifiaktivitat des Tetrahymena 
5 LSU Intron in E. coli 

Zum indirekten Nachweis , dass das modifizierte Intron in der 
vorbestimmten Umgebung innerhalb der I-Cpal Schnittstelle 
tatsSchlich Spleifien kann, wurde das modifizierte Tetrahymena 

10 Intron aus pCB220-17 zusammen mit einem Anteil, der die I-Cpal 
Erkennungsregion aus der Tabak 23SrDNA umgibt, so in das lacZ 
Gen des pBluescript kloniert, dass im Fall des Spleifcens dieses 
Introns in E. coli (Stamm XLl-Blue) ein funktionelles lacZ Peptid 
gebildet werden kann. Dessen Expression kann in geeigneten 

15 StSmmen durch dem Fachmann geiauf ige Verfahren durch Umsetzen der 
Subs t an z 5-Bromo-4-chloro-3-indolyl-PD-galactopyranosid (X-Gal ) 
im Medium zu einem blauen Farbstoff nachgewiesen werden. Der 
entsprechende Vektor wurde mit pCB315-l bezeichnet. Das lacZ 
Gen einschliefilich des Introns im Vektor pCB315-l ist durch 

20 SEQ ID NO: 9 beschrieben. Das Vektorrttckgrat ist identisch zum 
pBluescript. Die Sequenz umfasst nachfolgende Elemente: 

lacZ-5 'Anteil: komplementar (789-765) 

25 - multiple Klonierungsstelle aus dem pBluescript: komplementar 
(764-692) 

23SRDNA Fragment stromaufwarts und einschliefilich der I-Cpal 
Erkennungsregion: komplementar (691-682) 

30 

modifiziertes Tetrahymena Intron komplementar (681-269) 

23SRDNA Fragment stromabw&rts und einschliefilich der I-Cpal 
Erkennungsregion: komplementar (268-244) 

35 

multiple Klonierungsstelle aus dem pBluescript: komplementar 
(243-168) 

lacZ-5 'Anteil: komplementar (167-1) 

40 

Zur Kontrolle wurde ein Plasmid erstellt, das dem pCB315-l ent- 
spricht, nur dass in diesem Plasmid (pCB305-l) das Element far 
das modifizierte Tetrahymena Intron fehlte. pCB305-l diente somit 
als Positivkontrolle, um zu zeigen, dass das lacZ mit den im 
45 Leseraster eingebauten Nukleotiden aus der 23SrDNA vom Tabak- 
plastom noch funktionell ist. Dies spiegelt die Situation nach 
einem korrekten Spleifien des Tetrahymena Intron wieder, XLl-Blue 
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kompetente Zellen wurden mittels einer dem Fachmann gelSufigen 
Methode mit den Plasmiden pCB315-l und pCB305-l trans formiert. 
Je eine Einzelkolonie wurde auf LB (Bactotrypton: 10 g/L, Hefe- 
extrakt: 5 g/L, NaCl: 10 g/L, pH7,5) Platten, die 15g/L Bacto- 
5 Agar, 40 Jlg/L Ampicilin, 75 Jlg/L IPTG (Isopropyl-Pi>-Thiogalacto- 
pyranosid) und 80 Jlg/L X-Gal enthielten r tiber Nacht bei 37°C 
inkubiert. Tatsachlich fSrbten beide Klone blau, was nahe legt, 
dass das modifizierte Tetrahymena Intron in der nicht naturlichen 
Umgebung der Tabak 2 3 SrDNA im heterologen Organismus E. coli 
10 gespleifct wurde. 

10.3: Einfttgen von weiteren Sequenzen in das Tetrahymena LSU 
Intron 

15 Zusatzlich zu den Versuchen in Beispiel 10.2 wurde untersucht, ob 
weitere Elemente in das modifizierte Tetrahymena Intron eingebaut 
werden kSnnen, ohne die Spleifcaktivitat zu zerstfiren. Dazu wurde 
pCB315-l mit Bglll linearisiert und die uberhangenden Enden mit 
Hilfe des Klenow-Fragmentes aufgefullt. In diesen Vektor wurde 

20 so dann ein XhoI-SacI Fragment, wie es in pCB199-3 vorkommt, 
ebenfalls nach Behandlung mit dem Klenow- Fragment kloniert. 
Durch diese Klonierung wurde also ein 229bp groEes Fragment in 
das modifizierte Intron eingesetzt. Dieses Fragment enthalt eine 
I-Ppol Erkennungsregion . UnabhSngig von der Orientierung mit der 

25 das 229bp Fragment in das Tetrahymena Intron insertierte, konnte 
in dem Test wie unter Beispiel 10.2 beschrieben eine Blaufetrbung 
nachgewiesen werden. Dies legt nahe, dass das Tetrahymena- Intron 
sowohl an der gewiinschten Region in der 23S rDNA Spleifien kann, 
als auch zusatzliche genetische Information aufnehmen kann und 

30 trotzdem weiterhin eine Spleifcaktivitat gegeben ist. 

10.4 Transformation einer natxirlichen Masterpf lanze und 

Zerstorung der endogenen I-Cpal Erkennungsregion mit 
dem modif izierten Tetrahymena Intron 

35 

Nach dem in Beispiel 8 beschriebenen Prinzip wurde das modi- 
fizierte Tetrahymena Intron aus dem Vektor pCB220-17 mit Bpil 
ausgeschnitten und in den mit Bpil linearisierten Vektor pCB234-l 
kloniert. Der resultierende Vektor wurde pCB255-l genannt. 

40 pCB255-l wird gleichzeitig mit in vitro Transkript vom pCB262-5 
(mit Sail linearisiert, Nutzen der T7 Polymerase) nach dem in 
Beispiel 4 beschriebenen Verfahren auf Goldpartikel auf gebracht . 
Anschliefcend werden diese Goldpartikel analog zum Verfahren be- 
schrieben in Beispiel 4 in Tabak Pflanzen, VarietSt Petit Havana, 

45 geschossen. Gegebenenfalls k6nnen die Explantate auf Lincomycin 
(250 bis 500 mg/L) selektiert werden. 
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Beispiel 11: Ll.LtrB Intron aus Lactocococcus lactis 

Das Ll.LtrB Intron wurde einschlieSlich weniger Basen der 
flankierenden Exonsequenzen aus Lactococcus lactis mittels PCR 
5 durch Ausnutzen der Primer p207 und p208 amplif iziert . Das PCR 
Produkt wurde in den Vektor pCR2.1TA (Invitrogen) kloniert 
(PCB345-34) und sequenziert (SEQ ID NO: 10) . Es wurden wenige 
Abweichungen im Vergleich zur ver6f fentlichten Sequenz gefunden. 

10 p207 5 ' -GAGAAGACATTCCTAACACATCCATAACGTGCG-3 ' (SEQ ID NO: 32) 

p208 5 ' -TGAAGACTTGAC ATTTGATATGGTGAAGTAGG- 3 ' (SEQ ID NO: 33) 

Das klonierte Fragment in pCB345-34 (von der EcoRI bis zur EcoRI 
15 Schnittstelle des pCR2.1TA Vektors) ist durch SEQ ID NO: 10 
wiedergegeben . Der Rest des Vektors ist identisch zum Rttckgrat 
des pCR2.lTA. Die Sequenz umfasst nachfolgende Elemente: 

Anteil des naturlichen 5'Exon: komplementar (2540-2527) 

20 

Intron Ll.LtrB: komplementar (2526-35) 

ORF im Intron: komplementar (1953-154) 

25 - Anteil des naturlichen 3'Exon: kompleraentSr (34-28) 

Beispiel 12: Erstellen eines weiteren Derivates des Tetrahymena 
LSU Intron und Einbau eines Fremdgens in dieses In- 
tron-Der ivat , sowie Transformation in natiirliche Ma- 
30 sterpflanzen 

GemM.fi einer bevorzugten Aus fuhrungs form dieser Erfindung wurde 
ein artifizielles Intron erstellt, welches genau an der Stelle in 
das Plastidengenom eingebaut werden kann, an der sich auch das 

35 natiirliche Intron zugehSrig zu der betrachteten DSB-Erkennungsse- 
quenz befindet. Im vorliegenden Beispiel wurde das Tetrahymena 
LSU Intron derart modifiziert, dass es an der mit , AW gekenn- 
zeichneten Position in der im Rahmen dieser Erfindung identif i- 
zierten Erkennungsstelle far das DSBI-Enzym I-Cpal im Plastiden- 

40 genom hoherer Pflanzen splei&en kann: CGATCCTAAGGT^AGCGAAATTCA. 

Anschliefiend wurde das Gen codierend f\ir I-Cpal einschliefilich 
einer RBS in das Intron eingebaut. So wurde ein spleiSaktives , 
ein Fremdgen tragendes Intron erstellt, welches mittels des im 
45 Rahmen dieser Erfindung gefundenen Prozesses in die Plastiden ei- 
ner nattirlichen Masterpf lanze inmitten eines essentiellen Gens 
(kodierend fttr die 23S rRNA) eingebaut werden kann. 
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12.1: Erstellen eines weiteren Tetrahymena LSU Intron-Derivates 

Um ein an einer vordef inierten Insertionsstelle ein funktionelles 
Intronderivat zu erhalten, mufi die internal guide sequence (IGS) 
5 derart angepasst werden, dass sie Basenpaarungen mit dem 5' und 
3' Exon eingehen kann. Fig. 10 illustriert, wie diese Anpassung 
im vorliegenden Beispiel erfolgte, um ein Tetrahymena Intron-De- 
rivat zu erstellen, welches an der nattirlichen Insertionsstelle 
des CpLSU5 Intron innerhalb der I-Cpal Erkennungsregion spleissen 
10 kann. Analog kann eine Anpassung an jede beliebige Inertions- 
s telle vorgenommen werden. Das im Rahmen dieses Beispiels er- 
stellte Intron wurde mit TetIVS2a bezeichnet und ist durch SEQ ID 
NO: 73 beschrieben. 

15 12.2: Indirekter Nachweis der SpleifcaktivitSt des TetIVS2a In- 
trons in E. coli 

Analog zum Beispiel 10.2 wurde das TetIVS2a in das lacZ Gen des 
pBluescript eingebaut. Nach entsprechender Inkubation von E. coli 
20 XLl-blue Zellen, die das Plasmid pCB459-l enthielten, zeigte eine 
Blauf arbung die SpleifiaktivitSt des TetIVS2a Intron an der ge- 
wiinschten Position an. 

Bestandteile des Inserts aus Plasmides pCB459-l (SEQ ID NO: 74; 
25 Riickgrat entspricht pBluescript) 

lacZ-3 * Anteil einschliefclich Teile der multiplen Klonie- 
rungsstelle aus dem pBluescript (komplementar Pos. 1-254) 
Sequenz aus der I-Cpal Erkennungsregion (komplementar Pos. 
30 254-265) 

TetIVS2a (komplementar Pos. 266-678) 

Sequenz aus der I-Cpal Erkennungsregion (komplementar Pos. 
679-687) 

lacZ-5 1 Anteil einschlieSlich Teile der multiplen Klonie- 
35 rungsstelle aus dem pBluescript (komplementar Pos. 688-791) 

12.3: Einfiihren einer weiterer genetischer Information in das 
TetIVS2a Intron und Nachweis der Spleifiaktivitat in E. 
coli 

40 

Im Rahmen dieses Beispiels wird das Gen kodierend fiir das DSBI- 
Enzym I-Cpal in das TetIVS2a eingebracht, ohne dass dieses seine 
SpleiSaktivitat an besagter Position innerhalb der I-Cpal Erken- 
nungsregion verliert. Dazu wurde zunSchst in den Sequenzabschnitt 
45 des TetIVS2a, welcher dem Loop L8 im Tetrahymena LSU Intron ent- 
spricht, eine Bell Schnittstelle mittels PCR eingefttgt. Anschlie- 
Send wurde in diese Bell Schnittstelle ein nicht funktionelles 
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Derivat des Gens codierend far I-Cpal eingebaut. Da die Expres- 
sion von I-Cpal in E. coli toxisch ist, mufcte ftir den SpleiEtest 
in E.coli ein nicht-funktionelles Gen genutzt werden, welches zu- 
vor dadurch erzeugt wurde, dafc das entsprechende Gen an der EcoRI 
5 Schnitts telle linearisiert wurde, die tiberstehenden Enden durch 
Klenow-Behandlung gegeiattet wurden und anschliefcend die Genab- 
schnitte wieder zusammen ligiert wurden. Dadurch wurde ein Ra- 
sterschub im Leserahmen des Gens erzeugt. Durch den Einbau des 
besagten Intron mit dem nicht-funktionellen Gen in das lacZ Gen 

10 des pBluescript erhielten wir das Plasmid pCB478-3 und konnten 
analog zu Beispiel 12.2 mittels einer Blaufarbung entsprechender 
Kolonien die SpleiSaktivitat auch dieses Introns in E. coli an 
der gewiinschten Position innerhalb der I-Cpal Erkenunngsstelle 
nachweisen. Da sich das funktionelle Gen kodierend fur I-Cpal nur 

15 durch 4 Basen von dem in pCB478-3 genutzten nicht-funktionellen 
Gen unterscheidet , kann davon ausgegangen werden, daS das Intron 
auch nach Einbau des funktionellen I-Cpal Gens anstelle des 
nicht-funktionellen weiterhin die gewunschte SpleiSaktivitat be- 
sitzt . 

20 

Bestandteile des Inserts aus Plasmides pCB478-3 (SEQ ID NO: 75; 
Ruckgrat entspricht pBluescript) 

lacZ-3 l Anteil einschliefclich Teile der multiplen Klonie- 
25 rungsstelle aus dem pBluescript (komplement&r Pos. 1-265) 

Sequenz aus der I-Cpal Erkennungsregion (komplementar Pos. 
256-265) 

TetIVS2a (komplementar Pos. 266-1178), darin enthalten ein 
nicht-funktionelles Gen fiir I-Cpal ( komplementar Pos. 
30 399-861) sowie einer RBS stromaufwarts des nicht-funktionel- 

len I-Cpal Gens (komplementar 866-870) 

Sequenz aus der I-Cpal Erkennungsregion (komplementar Pos. 
1179-1187) 

lacZ-5* Anteil einschlieSlich Teile der multiplen Klonie- 
35 rungsstelle aus dem pBluescript (koplementar Pos. 1179-1291) 

12.4: Transformation eines sich selbst verbreitenden, artifi- 
ziellen Intron in einer natQrlichen Masterpf lanzen 

40 Nachdem gezeigt werden konnte, dass das TetIVS2a Intron an der 
gewiinschten Position spleiSen kann und ohne diese Spleifiaktivitat 
zu verlieren gleichzeitig weitere genet ische Information aufneh- 
men kauin, wurde ein Konstrukt erstellt, welches es ermoglichen 
soli, das I-Cpal Gen als ein Fremdgen mittels des im Rahmen die- 

45 ser Erf indung beschriebenen Verfahrens in das Plastidengenom ein- 
zubauen, ohne einen Selektionsmarker zu nutzen. Dazu wurde zu- 
nachst der Vektor pCB492-25 erstellt, welcher ein Insert mit fol- 
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gende Elemente umfasst (SEQ ID NO: 76; Riickgrat entspricht dem 
des pBluescript; Sequenz ist angegeben von BssHII bis BssHII in 
pBluescript, wobei die hier am 5 % Ende angegebene BssHII Schnitt- 
stelle, diejenige ira pBluescript ist, die naher am 3'Ende des 
5 lacZ Gens lokalisiert ist) : 

23SrDNA Fragment stromaufwSrts und einschlieSlich der I-Cpal 
Erkennungsregion (Pos. 37-203) 

TetIVS2a (Pos. 204-1112) mit eingefugtem Gen codierend fur 
10 I-Cpal (Pos. 521-979) sowie RBS (Pos. 512-516) 

23SrDNA Fragment stromabwarts und einschliefclich der I-Cpal 
Erkennungsregion (Pos. 1113-1247) 

Um eine Expression des I-Cpal direkt nach dem Einbringen in Pla- 
15 stiden von natiirlichen Masterpf lanzen zu gewShrleisten, wurde in 
vitro ein Promotor stromaufwarts des besagten Intron-Cpa Kon- 
struktes mittels PCR angefiigt. Dazu wurden die Primer p396 und 
p95 sowie pCB492-25 als Matritze genutzt. N 

20 p396 (SEQ ID NO: 77) : 

5 ' -TAGTAAATGAC AATTTTC C TCTGAATTATATAATTAAC ATGGCGACTGTTTAC C AAAAAC - 3 

p95 (SEQ ID NO: 78): 5 ' -CTCAATTGGGGTCTCTCTGTCC AGGTGC AGG - 3 ' 

25 Das entstandene PCR Produkt erhielt die Bezeichnung Prom-Te- 

tIVS2a-Cpa, ist beschrieben durch SEQ ID NO: 79 und umfaSte fol- 
gende Elemente: 

synthetischer Promotor (Pos. 8-40) 
30 - 23SrDNA aus Tabak stromaufwarts und einschlie&Lich Anteile 
der I-Cpal Erkennungsregion (Pos. 41-207) 

TetIVS2a (Pos. 208-1116) umfassend Gen codierend fur I-Cpal 
(Pos. 525-983) sowie RBS (Pos. 516-520) 

23SrDNA aus Tabak stromabwarts und einschliefclich Anteile der 
35 I-Cpal Erkennungsregion (Pos. 1117-1243) 

Das Plasmid pCB492-25 wurde gleichzeitig mit dem beschriebenen 
PCR-Produkt Prora-TetIVS2a-Cpa wie in Beispiel 4 beschrieben auf 
Goldpartikel aufgebracht und anschlie£end auf Wildtyp Tabak ge- 

40 schossen. Durch die Expression des I-Cpal Enzyms soil ein Doppel- 
strangbruch in der 2 3 SrDNA erfolgen, welcher durch das einge- 
brachte PCR Produkt oder durch die eingebrachte Insertionsseguenz 
des Plasmides pCB492-25 repariert wird. Dadurch wird die naturli- 
cherweise vorhandene I-Cpal Erkennungsregion in den bereits 

45 trans formier ten Plastomkopien inaktiviert .Ohne jedlichen Selek- 
tionsdruck wurden Pflanzen regeneriert und diese werden mittels 
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PCR auf die Anwesenheit der Insertionssequenz im Plastom gete- 
stet. 

Beispiel 13: Verbreitung des modif izierten Tetrahymena LSU Intron 
5 aus pCB255-l in einer nattirlichen Masterpf lanze durch 

Expression des DSBI-Enzyms I-Cpal in trans 

Im Rahmen dieses Beispiels wird gezeigt, wie ein DSBI-Enzym in 
den Plastiden von Masterpf lanzen zur Expression gebracht werden 
10 kann, um eine Insertionssequenz in den Kopien der Masterpf lanze 
effizient zu verbreiten. 

13.1: Erstellen eines Vektors ftir die Plastidentransformation, 
der die Expression der Homing Endonuklease I-Cpal in Pla- 
15 stiden erlaubt 

Zunachst wurde ein Vektor erstellt, der fttr den Selektionsmarker 
aadA sowie das DSBI-Enzym I-Cpal kodiert. Da die Expression des 
I-Cpal Enzyms in E. coli letal ist, wurde der accD Promotor ge- 

20 w^hlt, um die Expression dieses Enzyms in den Plastiden zu erm6g- 
lichen/ aber die Expression in E. coli zu verhindern. So konnte 
dieser Vektor auf konventionelle Art und Weise mit E. coli als 
Wirtsorganismus erstellt und amplifiziert werden. Der resultie- 
rende Vektor wurde mit pCB435-45 bezeichnet und umfafcte ein In- 

25 sert gemafc SEQ ID NO: 80 mit folgenden Elementen: 

Rechte Zielregion (wie in pCB42-94, siehe oben; komplementar 
Pos. 66-1403) 

Promotor PaccD (Pos. 1422-1478) 

30 - RBS (Pos. 1500-1504) 

Gen codierend fur I-Cpal (Pos. 1509-1967) 
Expressionskassette fttr das Markergen aadA bestehend aus: 
der 3* Bereich des psbA Gens (komplementSr Pos. 2065-1974) 
aadA Gen (komplentSr Pos. 2872-2078) 

35 - 5* untranslatierte Bereiche des Tabak rbcL Gens (komplementSr 
Pos. 2890-2873), teilweise mutiert 

Promotor des Gens fttr die 16SrRNA (komplement&r Pos. 2987 bis 
2897) 

Linke Zielregion (wie in pCB42-94, siehe oben; komplement&r 
40 Pos. 3863-3007) 

Teile des pBluescript (einschliefclich „ origin of replica- 
tion*; Pos. 3864-4746 und 1-65) 



45 
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13.2 Co-Transformation von pCB435-45 und pCB255-l in nattirli- 
che Masterpflanzen 

Entsprechend den Ausfuhrungen in Beispiel 4 wurden die Plasmide 
5 pCB435-45 und pCB255-l gleichzeitig auf Goldpartikel aufgebracht 
und so dann mittels der Partikelkanone in Plastiden von Tabak- 
blattern eingebracht. Analog zu Beispiel 4 wurden Transplastome 
Pflanzen auf Regenerationsmedium zuztiglich 500 mg/L Spectinomycin 
selektiert. Sobald Pflanzchen entstanden waren, wurden diese auf 

10 Anzuchtmedium zuzttglich 500 mg/L Spectinomycin umgesetzt und 
Blattmaterial geerntet. Dieses Blattmaterial wurde mittels Sou- 
thernanalyse unter Verwendung des Dig-Easy Hyb* (Roche Diagno- 
stics; Mannheim) in Hinblick auf den Einbau der beiden Plasmide 
in das Plastidengenom analysiert. Um den Anteil der Plastomkopien 

15 zu bestimmen, die bzgl. der Insertionssequenz aus pCB435-45 

transgen waren, wurde eine Sonde benutzt, die eine Sequenz gemaS 
SEQ ID NO: 81 besaS (gerichtet gegen Teile der 16SrDNA) . 

Um den Anteil der Plastomkopien zu bestimmen, die bzgl. der In- 
20 sertionssequenz aus pCB255-l transgen waren, wurde eine Sonde be- 
nutzt, die eine Sequenz gemafc SEQ ID NO: 82 besaS (gerichtet ge- 
gen Teile der 23SrDNA) . 

Fig. 11 zeigt, dass in diesem Experiment 2 Linien 
25 (CB255+435NTH-19 und -20) identif iziert wurden, die sowohl bzgl. 
der Insertionssequenz aus pCB435-45 als auch der aus pCB255-l 
transgen sind. Weiter konnte so gezeigt werden, dass tiberraschen- 
derweise die Insertionssequenz aus pCB255-l (modif iziertes Tetra- 
hymena LSU Intron) bereits in mehr Kopien des Plastidengenoms 
30 verteilt wurde, als die Insertionssequenz aus pCB435-45 - obwohl 
auf das Ereignis der Insertion der Insertionssequenz aus 
pCB435-45 selektiert wurde (aadA Markergen befindet sich in 
pCB435-45). Die Wirksamkeit des im Rahmen dieser Erfindung be- 
schriebenen Verfahrens - namlich der Insertion und schnellen Ver- 
35 teilvuag einer Insertionssequenz im Plastidengenom, ohne dass auf 
die Anwesenheit dieser selektiert wiirde, durch das Nutzen von 
DSBI-Enzymen und entsprechende Erkennungsstellen - konnte somit 
in diesem Beispiel far besagte Linien nachgewiesen werden. 
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Beispiel 14: Erzeugen von weiteren Masterpf lanzen mit einer 

nicht-natttrlicherweise in Plastiden vorkommenden DSB- 
Erkennungsregion, sowie Trans format ion dieser Pflan- 
zen unter Ausnutzen des DSBI-Enzyms I-Ppol 

5 

14.1: Erstellen eines weiteren Vektors (pCB456-2) ftir die Ein- 
bringung einer nicht nattirlicherweise vorkommenden Erken- 
nungsregion fiir die Homing Endonuklease I-Ppol in das 
Plastom von Tabak 

10 

Ziel dieses Ansatzes war es (analog zu Beispiel 3) einen weiteren 
Vektor ftir die Plastidentransf ormation zu erstellen, welcher 
keine umfassenden Homologien zu Sequenzen im Plastidengenom be- 
sitzt . 

Der Selektionsmarker aadA ist in diesem Plasmid unter Kontrolle 
eines synthetischen Promotors, der abgeleitet ist von der Konsen- 
sus Sequenz ftir E. coli O70 Promotoren. Als 3*Ende wurde ein Be- 
reich stromabwarts des 3*psbA-l Gens aus Synechocystis genutzt. 

20 Im Unterschied zu dem bereits beschriebenen Vektor pCB199-3 wurde 
hier die DSB-Erkennungssequenz direkt stromabwarts des aadA Gens, 
aber stromaufwarts der 3*pshA-l Sequenz aus Synechocystis in das 
Molektil eingeftihrt. Damit kann man nach Insertion einer Inserti- 
onssequenz mit Hilfe eines DSBI-Enzyms ein Operon erstellen. Die 

25 Gene auf der Insertionssequenz kfinnen dann - optional - ohne Pro- 
motor auf der Insertionssequenz insert iert werden. Nach der In- 
sertion gelangen entsprechende Gene der Insertionssequenz dann 
auch unter Kontrolle des synthetischen Promotors stromaufwarts 
des aadA Gens in der Masterpf lanze. Dadurch kann man - optional - 

30 eine Operon Struktur bestehend aus dem aadA und den nachfolgend 
eingeftihrten Genen im Plastom erzeugen. 

Zur Herstellung des Plasmides pCB456-2 wurden sukzessive ver- 
schiedene Elemente in den Basisvektor pCB42-94 kloniert: 

35 

Synthetischer Promotor (komplementar bp 1226-1260) 
Ribosomenbindestelle (komplement&r bp 1214-1218) 
aadA Gen (komplementar bp 414-1208) 

Core-Erkennungsregion far die Homing Endonuklease I-Ppol 
40 (komplementar bp 331-345) 

3 'psbA-1 aus Synechocystis (komplementar bp 19-155) 

Der so erhaltene Vektor vermittelt auch in E. coli eine Spectino- 
mycin Resistenz. Anstelle der multiplen Klonierungsstelle im Ba- 
45 sisvektor pCB42-94 fiir die Plastiden trans format ion enthalt dieser 
Vektor mit der Bezeichnung pCB456-2 die aufgefOhrten Elemente im 
Rahmen der Nukleins&uresequenz mit der SEQ ID NO: 83. Auch hier 
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ist die gesamte MCS ersetzende Sequenz (von SacI bis Kpnl) ange- 
geben . 

14 . 2 : Erstellen von uberwiegend homotransplastomen Masterpf lan- 
5 zen, die eine nicht naturliche DSB-Erkennungssequenz ent- 

halten 

Analog zu pCB199-3 in Beispiel 4 wurde der Vektor pCB456-2 in die 
Plastiden von Tabak eingebracht. Abweichend von der Beschreibung 

10 in Beispiel 4 wurden die erhaltenen Sprosse jedoch auf Anzuchtme- 
dium, welches 30 g/L Sacharose enthielt (anstelle der in Beispiel 
4 angegebenen 10 g/L) t kultiviert. Die resultierenden Pflanzen 
wurden mit CB456NTH bezeichnet. Mittels Southern-Hybridisierung 
wurden von den Spectinomycin resistenten Pflanzen, die nach der 

15 Transformation erhalten wurden, 2 Linien (CB456NTH-1 und -15, 
vgl. Fig. 12) identif iziert, die die Insertionssequenz aus 
PCB456-2 in ihr Plastom eingebaut haben. In dem Southern-Experi- 
ment wurde eine Sonde genutzt, welche gegen ein Fragment der 
16SrDNA gerichtet war (vgl. oben Beispiel 13.2) • Diese Sonde war 

20 geeignet, urn aus mit EcoRI verdauter DNA, die dem Wildtyp ent- 
spricht, ein Fragment von etwa 3,1 kb nachzuweisen. Im Gegensatz 
dazu wurde ein etwa 1,7 kb grofces Fragment detektiert, wenn in 
die entsprechenden Plastomkopien die Insertionssequenz aus 
pCB456-2 eingebaut worden war. 

25 

14.3: Erstellen eines Trans format ionsvektors fttr artif izieiles 
Homing in den Masterpf lanzen CB456NTH 

ZunSchst wurde eine Operonstruktur bestehend aus den Elementen 
30 RBS - nptll (codierend fur ein Enzym, welches Kanamycin Resistenz 
vermittelt) - RBS - I-Ppol (codierend fur ein DSBI-Enzym) er- 
stellt. Diese Kassette wurde mit BstXI Schnittstellen umgeben, 
die nach Einwirkung des Enzyms BstXI DNA-Enden erzeugen, die kom- 
patibel zu den durch das Enzym I-Ppol erzeugten DNA-Enden sind. 
35 Der result ierende Vektor (Ruckgrat entspricht dem des pBlues- 
cript) wurde mit pCB528-2 bezeichnet, enth&lt ein Insert gemaS 
SEQ ID NO: 84 mit folgenden Elementen: 

RBS (Pos. 28-32) 
40 - nptll (Pos. 27-840) 
RBS (Pos. 849-853) 

Gen codierend fur I-Ppol (Pos. 859-1350) 

AnschlieEend wurde mit BstXI das 1360 bp groSe Fragment aus 
45 pCB528-2 heraus geschnitten und in die I-Ppol Schnittstelle im 
Vektor pCB456-2 ligiert. Aus den erhaltenen Klonen nach Transfor- 
mation der Ligationsprodukten in E. coli wurden solche ausge- 
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w&hlt, die eine Kanamycin Resistenz besaEen. Dadurch wurde si- 
chergestellt, dass besagtes Insert in dem entsprechenden Klon 
derart in den Vektor insertiert war, dass die nptll und I-Ppol 
Kassette in der selben Orient ierung vorlagen, wie die aadA-Kas- 
5 sette. Dies wurde auch durch das dem Fachmann bekannte Verfahren 
der Restriktionsanalyse verifiziert. Der entsprechende Vektor er- 
hielt die Bezeichnung pCB535-ll. 

14.4: Transformation von pCB535-ll in Masterpf lanzen CB456NTH 
10 Analog zu pCB456-2 in Beispiel 14.2 wurde pCB535-ll auf Goldpar- 
tikel aufgebracht und anschliefcend mittels Partikelkanone in Pla- 
stiden der Masterpf lanze CB456NTH-1 eingebracht. 

Ein Teil der Explantate wurde ohne jeglichen Selektionsdruck auf 
15 Regenerationsmedium inkubiert. Entstandene Pf lanzen wurden auf 
Anzuchtmedium (wieder ohne Selektionsdruck uberftihrt) . Anschlie- 
fcend werden die Pflanzen mittels PCR in Hinblick auf die Anwesen- 
heit der RBS - nptll - RBS - I-Ppol Kassette analysiert. 

20 Ein anderer Teil der Explantate wurde auf Regenerationsmedixom zu- 
zuglich 15 bzw. 30 mg/L Kanamycin inkubiert. Nach je 2 Wochen 
werden die Pflanzen auf frisches Regenerationsmedium umgesetzt 
und die Kanamycinkonzentration sukzessive bis 50 bzw. 80 mg/L er- 
hSht . 

25 
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Patentansprtiche 

1. Verfahren zur Integration einer DNA-Sequenz in die plastidare 
5 DNA einer mehrzelligen Pflanze oder von dieser abgeleiteten 

Zelle und zur Selektion tiberwiegend homotransplastomer Zellen 
oder Pflanzen, dadurch gekennzeichnet, dass 

a) die plastidaren DNA-Molektile besagter mehrzelliger 

10 Pflanze mindestens eine Erkennungssequenz zur gezielten 

Induktion von DNA-Doppelstrangbrtichen enthalten und 

b) mindestens ein Enzym geeignet zur Induktion von 
DNA-Doppelstrangbrtichen an der Erkennungssequenz zur 

15 gezielten Induktion von DNA-Doppelstrangbrtichen sowie 

mindestens ein Transformationskonstrukt umfassend eine 
Insertionssequenz in mindestens einem Plastid besagter 
mehrzelligen Pflanze oder von dieser abgeleiteten Zelle 
zusammengebracht werden, und 

20 

c) die Induktion von DNA-Doppelstrangbrtichen an den 
Erkennungssequenzen zur gezielten Induktion von DNA- 
Doppelstrangbrtichen erfolgt, und 

25 d) die Insertionssequenz in die plastidare DNA insertiert, 

wobei die Funktionalitat der Erkennungssequenz zur ge- 
zielten Induktion von DNA-Doppelstrangbrtichen deaktiviert 
wird, so dass besagte Erkennungssequenz nicht mehr durch 
das Enzym geeignet zur Induktion von DNA-Doppelstrang- 

30 brtichen geschnitten werden kann, und 

e) Pflanzen oder Zellen isoliert werden, bei denen die 
Insertionssequenz in die plastidaren DNA-Molektile 
insertiert wurde. 

35 

2. Verfahren nach Anspruch 1, dadurch gekennzeichnet, dass die 
Erkennungssequenz zur gezielten Induktion von DNA-Doppel- 
strangbrtichen sowie die Insertionssequenz zumindest ein- 
seitig von Sequenzen f lankier t sind, die eine ausreichende 

40 Lange und ausreichende Homologie aufweisen, urn eine homologe 

Rekombination untereinander zu gewahrleisten. 

3 . Verfahren nach einem der Ansprtiche 1 oder 2 , dadurch gekenn- 
zeichnet, dass das Transformationskonstrukt mindestens eines 

45 der Elemente beinhaltet ausgewahlt aus der Gruppe bestehend 

aus 
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i) Expressionskassette fiir ein Enzym, geeignet zur 
Induktion von DNA-Doppelstrangbruchen an der 
Erkennungssequenz zur gezielten Induktion von 
DNA-Doppel s t r angbrtichen 

5 

ii) Positiven Selektionsmarkern 

iii) Negativen Selektionsmarkern 
10 iv) Report ergenen 

v) ReplikationsursprQngen 

vi) Multiple Klonierungsregionen 

vii) "Border" -Sequenzen fur Agrobakterium-Transf ektion 



15 



viii) Sequenzen, die eine homologe Rekombination bzw. 
Insertion in das Genom eines Wirtsorganismus 
20 erm6glichen 

4. Verfahren nach einem der Anspruche 1 bis 3, dadurch gekenn- 
zeichnet, dass ein Enzym geeignet zur Induktion von DNA- 
Doppelstrangbrtichen an der Erkennungssequenz zur gezielten 

25 Induktion von DNA-Doppelstrangbrttchen ausgewahlt ist aus der 

Gruppe bestehend aus Restriktionsendonukleasen, Homing-Endo- 
nukleasen, Chimare Nukleasen, mutierte Restriktions- oder 
Homing-Endonukleasen und RNA-Froteinpartikel abgeleitet von 
mobilen Intronen der Gruppe II, sowie Fusionsproteinen der 

30 vorgenannten Proteine mit Plastidenlokalisationssequenzen. 

5. Verfahren nach einem der Ansprtiche 1 bis 4, dadurch gekenn- 
zeichnet, dass das Enzym geeignet zur Induktion von DNA- 
Doppelstrangbruchen an der Erkennungssequenz zur gezielten 

35 Induktion von DNA-Doppelstrangbrtichen ausgewahlt ist aus 

der Gruppe der Homing-Endonukleasen bestehend aus F-Scel, 
F-Scell, F-Suvl, F-Tevl f F-TevII, I-Amal, I -Anil, I-Ceul, 
I-CeuAIIP, I-Chul, I-Cmoel, I-Cpal, I-CpaII, I-Crel, 
I-CrepsbIP, I-CrepsbIIP, I-CrepsbIIIP, I-CrepsbIVP, I-Csral, 

40 I-Cvul, I-CvuAIP, I-DdiII, I-Dirl, I-Dmol, I-HspNIP, I-Llal, 

I-Msol, I-Naal, I-NanI, I-NclIP, I-NgrIP, I-NitI, I-Njal, 
I-Nsp236IP, I-PakI, I-PboIP, I-PcuIP, I-PcuAI, I-PcuVI, 
I-PgrIP, I-PobIP, I-Porl, I-PorIIP, I-PpbIP, I-Ppol, 
I-SPBetaIP, I-Scal, I-Scel, I-SceII, I-SceIII, I-SceIV, 

45 I-SceV, I-SceVI, I-SceVII, I-SexIP, I-SneIP, I-SpomCP, 

I-SpomIP, I-SpomIIP, I-SquIP, I-Ssp6803I, I-SthPhiJP, 
I-SthPhiST3P, I-SthPhiS3bP, I-TdeIP, I-TevI, I-TevII, 
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I-TevIII, I-UarAP, I-UarHGPAlP, I-UarHGPA13P, I-VinIP, 
I-ZbiIP, PI-MtuI, PI-MtuHIP, PI-MtuHIIP, Pl-Pful, Pl-PfuII, 
Pl-Pkol, Pl-PkoII, PI-PspI, PI-Rma43812lP, PI-SPBetalP, 
Pl-Scel, PI-Tful, PI-TfuII, PI-Thyl, PI-Tlil, PI-TliII 
5 sowie Fusionsproteinen der vorgenannten mit plastidSren 

Lokalisationssequenzen . 

6. Verfahren nach einem der Ansprtiche 1 bis 5, dadurch gekenn- 
zeichnet, dass das Enzym geeignet zur Induktion von DNA- 
10 Doppelstrangbriichen an der Erkennungssequenz zur gezielten 

Induktion von DNA-Doppelstrangbrtichen ausgewShlt ist aus der 
Gruppe der Homing-Endonukleasen bestehend aus den Enzymen 
gemas SEQ ID NO: 5, 12, 14 und 71. 

15 7. Verfahren nach einem der Ansprttche 1 bis 6, dadurch gekenn- 
zeichnet, dass das Enzym geeignet zur Induktion von DNA- 
Doppelstrangbruchen an der Erkennungssequenz zur gezielten 
Induktion von DNA-Doppelstrangbrtichen unter Verwendung einer 
Expressionskassette exprimiert wird, die eine ftir das besagte 

20 Enzym kodierende Nukleins&uresequenz beinhaltet. 

8. Expressionkassette enthaltend ein Enzym geeignet zur 
Induktion von DNA-Doppelstrangbrtichen an der Erkennungs- 
sequenz zur gezielten Induktion von DNA-Doppelstrangbruchen 

25 gemaS Definition einer der Anspruche 4 bis 6 unter Kontrolle 

eines in pflanzlichen Plastiden funtionellen Promotors. 

9 . Expressionkassette enthaltend ein Fusionsprotein aus einer 
Plastidentranslokalisationssequenz und einem Enzym geeignet 

30 zur Induktion von DNA-Doppelstrangbruchen an der Erkennungs- 

sequenz zur gezielten Induktion von DNA-Doppelstrangbriichen 
gemSfi Definition einer der Ansprtiche 4 bis 6 unter Kontrolle 
eines im pflanzlichen Zellkern funktionellen Promotors. 

35 10. Mehrzellige Pflanze erhalten nach einem Verfahren gemSS einem 
der Ansprtiche 1 bis 7. 

11. Mehrzellige Pflanze enthaltend eine Expressionskassette gemafc 
Anspruch 8 insert iert in die plastidare DNA. 

40 

12. Mehrzellige Pflanze enthaltend eine Expressionskassette gemaS 
Anspruch 9 insertiert in die nukleSre DNA. 

13 . Mehrzellige Pflanze nach einem der Ansprtiche 10 oder 12 aus- 
45 gewMhlt aus der Gruppe bestehend aus Arabidopsis thaliana, 

Tabak, Tagetes, Weizen, Roggen, Gerste, Hafer, Raps, Mais, 
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Kartoffel, Zuckerrtibe, Soja, Sonnenblume, Kxirbis oder Erd- 
nuss . 

14* Zellkulturen, Organe, Gewebe, Teile oder transgenes Ver- 
5 mehrungsgut abgeleitet von einer mehrzellige Pf lanze nach 

den AnsprGchen 10 bis 13. 

15. Verwendung eines Organismus nach einem der Anspruche 10 bis 
13 oder von diesem abgeleitete Zellkulturen, Organe, Gewebe, 

10 Teile oder transgenes Ventiehrungsgut nach Anspruch 14 als 

Nahrungs-, Futtermittel oder Saatgut oder zur Herstellung 
von Pharmazeutika oder Feinchemikalien. 

16. DNA-Konstrukt umfassend mindestens eine Nukleinsauresequenz 
15 sowie Intronsequenzelemente, die befahigt sind, in einer von 

besagtem DNA-Konstrukt abgeleiteten Ribonukleinsauresequenz 
die Deletion des fur besagte Nukleinsauresequenz kodierenden 
RibonukleinsSurefragmentes zu gewahrleisten, wobei besagte 
die Nukleinsauresequenz in Bezug auf besagte Intronsequen- 
20 zelemente heterolog ist. 

17. DNA-Konstrukt nach Anspruch 16, wobei die Nukleinsauresequenz 
zumindesten von einer SpleiSakzeptorsequenz und einer Spleifc- 
donorsequenz flankiert ist. 

25 

18. DNA-Konstrukt nach Anspruch 16 oder 17, wobei das DNA-Kon- 
strukt am 5'- und 3'-Ende Sequenzen HI bzw. H2 umfafct, die 
eine ausreichende LSnge und Homologie zu plastidaren Sequen- 
zen Hi' bzw. H2' aufweisen, um eine homologe Rekombination 

30 zwischen HI und Hi' bzw. H2 und H2' und damit eine Insertion 

der von HI und H2 flankierten Sequenz in das Plastom zu ge- 
wahrleisten. 

19. Transgene Plastiden-DNA umfassend mindestens eine Nukleinsau- 
35 resequenz sowie Intronsequenzelemente, die befahigt sind, in 

einer von besagter transgenen Plastiden-DNA abgeleiteten Ri- 
bonukleinsauresequenz die Deletion des ftir besagte Nuklein- 
sauresequenz kodierenden Ribonukleinsauref ragmentes zu ge- 
wahrleisten, wobei die besagte Nukleinsauresequenz in Bezug 
40 auf besagte Intronsequenzelemente heterolog ist. 

20. Transgene Plastiden-DNA nach Anspruch 19, wobei die Nuklein- 
sauresequenz zumindesten von einer Spleifcakzeptorsequenz und 
einer Spleifcdonorsequenz flankiert ist. 

45 

21. Transgene Pflanze, umfassend eine transgene Plastiden DNA ge- 
ma£ Anspruch 20. 
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SEQUENZPROTOKOLL 

.• 

<110> SunGene GmbH & Co.KGaA 

<120> Verfahren zur Transformation von pflanzlichen Plastiden 

<130> AE20010854 / PF 0081700028 

<140> 
<141> 

<160> 84 

<170> Patentln Ver. 2.1 

<210> 1 
<211> 4363 
<212> DNA 

<213> Ktxnstliche Sequenz 
<220> 

<223> Beschreibung der kttnstlichen Sequenz: plastid 
transformation plasmid pCB42-94 

<220> 

<221> misc_feature 
<222> (55) . . (1405) 
<223> right targeting region 

<220> 

<221> mutation 
<222> (346) 

<223> mutation causing streptomycin resistence 
<220> 

<221> mutation 
<222> (68) 

<223> mutation causing spectinomycin resistence 
<220> 

<221> misc_feature 

<222> (1404) (1511) 

<223> multiple cloning site 

<220> 

<221> misc_feature 
<222> (2629) (3417) 
<223> Ampicilin resistence 

<400> 1 

gcgcccaata cgcaaaccgc ctctccccgc gcgttggccg attcattaat gcagtgatga 60 
cttgacggca tcctcacctt cctccggctt atcaccggca gtctgttcag ggttccaaac 120 
tcaacgatgg caactaaaca cgagggttgc gctcgttgcg ggacttaacc caacacctta 180 
cggcacgagc tgacgacagc catgcaccac ctgtgtccgc gttcccgaag gcacccctct 240 
ctttcaagag gattcgcggc atgtcaagcc ctggtaaggt tcttcgcttt gcatcgaatt 300 
aaaccacatg ctccaccgct tgtgcgggcc cccgtcaatt ccttttagtt tcattcttgc 360 
gaacgtactc cccaggcggg atacttaacg cgttagctac agcactgcac gggtcgatac 420 
gcacagcgcc tagtatccat cgtttacggc taggactact ggggtatcta atcccattcg 480 
ctcccctagc tttcgtctct cagtgtcagt gtcggcccag cagagtgctt tcgccgttgg 540 
tgttctttcc gatctctacg catttcaccg ctccaccgga aattccctct gcccctaccg 600 
tactccagct tggtagtttc caccgcctgt ccagggttga gccctgggat ttgacggcgg 660 
acttaaaaag ccacctacag acgctttacg cccaatcatt ccggataacg cttgcatcct 720 
ctgtattacc gcggctgctg gcacagagtt agccgatgct tattccccag ataccgtcat 780 
tgcttcttct ccgggaaaag aagttcacga cccgtgggcc ttctacctcc acgcggcatt 840 
gctccgtcag gctttcgccc attgcggaaa attccccact gctgcctccc gtaggagtct 900 
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gggccgtgtc tcagtcccag tgtggctgat 
cttggtaagc tattgcctca ccaactagct 
tcctcctttt gctcctcagc ctacggggta 
cccaagggca ggttcttacg cgttactcac 
ccgacttgca tgtgttaagc atgccgccag 
atgagattca tagttgcatt acttatagct 
ttgtctttca ttccaaggca taacttgtat 
tcccagaaat atagccatcc ctgccccctc 
tcattgaacg acggcggggg agcgagctcc 
gatcccccgg gctgcaggaa ttcgatatca 
ggcccggtac caaatccaac tagaaaaact 
actgatgact tccaccacgt caaggtgaca 
cccatcgaga aatagaactg actaatccta 
attcttgaac aacttggagc cgggccttct 
gtcaaaatcg gattcaattg tcaactgccc 
gaaggaactg gagttacatc tcttttccat 
ttgagacccc gaaaaatgga caaattcctt 
acaaaaagga taatggtaac cctaccatta 
gaaatacatg tcctaccgag acagaatttg 
agatttacct ccgtggaaag gatgattcat 
ccagaatcca tgttgtatat ttgaaagagg 
cctcttcccg ccgagcccct tttctcctcg 
caacaattca tcagactcac taagtcggga 
tctaatatat ctaatataat agaaaatact 
atactttccc cggttccgtt gctaccgagg 
atgtcatgat aataatggtt tcttagacgt 
gaacccctat ttgtttattt ttctaaatac 
aaccctgata aatgcttcaa taatattgaa 
gtgtcgccct tattcccttt tttgcggcat 
cgctggtgaa agtaaaagat gctgaagatc 
tggatctcaa cagcggtaag atccttgaga 
tgagcacttt taaagttctg ctatgtggcg 
agcaactcgg tcgccgcata cactattctc 
cagaaaagca tcttacggat ggcatgacag 
tgagtgataa cactgcggcc aacttacttc 
ccgctttttt gcacaacatg ggggatcatg 
tgaatgaagc cataccaaac gacgagcgtg 
cgttgcgcaa actattaact ggcgaactac 
actggatgga ggcggataaa gttgcaggac 
ggtttattgc tgataaatct ggagccggtg 
tggggccaga tggtaagccc tcccgtatcg 
ctatggatga acgaaataga cagatcgctg 
aactgtcaga ccaagtttac tcatatatac 
ttaaaaggat ctaggtgaag atcctttttg 
agttttcgtt ccactgagcg tcagaccccg 
ctttttttct gcgcgtaatc tgctgcttgc 
tttgtttgcc ggatcaagag ctaccaactc 
cgcagatacc aaatactgtc cttctagtgt 
ctgtagcacc gcctacatac ctcgctctgc 
gcgataagtc gtgtcttacc gggttggact 
ggtcgggctg aacggggggt tcgtgcacac 
aactgagata cctacagcgt gagctatgag 
cggacaggta tccggtaagc ggcagggtcg 
ggggaaacgc ctggtatctt tatagtcctg 
gatttttgtg atgctcgtca ggggggcgga 
ttttacggtt cctggccttt tgctggcctt 



catcctctcg gaccagctac tgatcatcgc 960 
aatcagacgc gagcccctcc tcgggcggat 1020 
ttagcagccg tttccagctg ttgttcccct 1080 
ccgtccgcca ctggaaacac cacttcccgt 1140 
cgttcatcct gagccaggat cgaactctcc 1200 
tccttgttcg tagacaaagc ggattcggaa 1260 
ccatgcgctt catattcgcc cggagttcgc 1320 
acgtcaatcc cacgagcctc ttatccattc 1380 
accgcggtgg cggccgctct agaactagtg 1440 
agcttatcga taccgtcgac ctcgaggggg 1500 
cacattgggc ttagggataa tcaggctcga 1560 
ctctaccgct gagttatatc ccttccccgc 1620 
agtcaaaggg tcgagaaact caacgccact 1680 
tttcgcacta ttacggatat gaaaataatg 1740 
ctatcggaaa taggattgac taccgattcc 1800 
tcaagagttc ttatgcgttt ccacgcccct 1860 
ttcttaggaa cacatacaag attcgtcact 1920 
actacttcat ttatgaattt catagtaata 1980 
gaacttgcta tcctcttgcc tagcaggcaa 2040 
tcggatcgac atgagagtcc aactacattg 2100 
ttgacctcct tgcttctctc atggtacact 2160 
gtccacagag acaaaatgta ggactggtgc 2220 
tcactaacta atactaatct aatataatag 2280 
aatataatag aaaagaactg tcttttctgt 2340 
gcctcgtgat acgcctattt ttataggtta 2400 
caggtggcac ttttcgggga aatgtgcgcg 2460 
attcaaatat gtatccgctc atgagacaat 2520 
aaaggaagag tatgagtatt caacatttcc 2580 
tttgccttcc tgtttttgct cacccagaaa 2640 
agttgggtgc acgagtgggt tacatcgaac 2700 
gttttcgccc cgaagaacgt tttccaatga 2760 
cggtattatc ccgtattgac gccgggcaag 2820 
agaatgactt ggttgagtac tcaccagtca 2880 
taagagaatt atgcagtgct gccataacca 2940 
tgacaacgat cggaggaccg aaggagctaa 3000 
taactcgcct tgatcgttgg gaaccggagc 3060 
acaccacgat gcctgtagca atggcaacaa 3120 
ttactctagc ttcccggcaa caattaatag 3180 
cacttctgcg ctcggccctt ccggctggct 3240 
agcgtgggtc tcgcggtatc attgcagcac 3300 
tagttatcta cacgacgggg agtcaggcaa 3360 
agataggtgc ctcactgatt aagcattggt 3420 
tttagattga tttaaaactt catttttaat 3480 
ataatctcat gaccaaaatc ccttaacgtg 3540 
tagaaaagat caaaggatct tcttgagatc 3600 
aaacaaaaaa accaccgcta ccagcggtgg 3660 
tttttccgaa ggtaactggc ttcagcagag 3720 
agccgtagtt aggccaccac ttcaagaact 3780 
taatcctgtt accagtggct gctgccagtg 3840 
caagacgata gttaccggat aaggcgcagc 3900 
agcccagctt ggagcgaacg acctacaccg 3960 
aaagcgccac gcttcccgaa gggagaaagg 4020 
gaacaggaga gcgcacgagg gagcttccag 4080 
tcgggtttcg ccacctctga cttgagcgtc 4140 
gcctatggaa aaacgccagc aacgcggcct 4200 
ttgctcacat gttctttcct gcgttatccc 4260 
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ctgattctgt ggataaccgt attaccgcct ttgagtgagc tgataccgct cgccgcagcc 4320 
gaacgaccga gcgcagcgag tcagtgagcg aggaagcgga aga 4363 

<210> 2 
<211> 1359 
<212> DNA 

<213> Ktinstliche Sequenz 
<220> 

<223> Beschreibung der kiinstlichen Sequenz: Insert of 
vector pCB199-3 

<400> 2 

gagctctgat cacggaagat 
gatgttaatt gtgttggcaa 
actagagctt cgggtgccag 
cttaagagag tcaagcttct 
aaggagcaat agcaccctct 
aacctcctat agactaggcc 
tcgcctttca cgtagtggac 
tcttcttgtc caagataagc 
aggcgctcca ttgcccagtc 
ctgtaccaaa tgcgggacaa 
ggcgagttcc atagcgttaa 
ggatcaaaga gttcctccgc 
gtcagcaaga tagccagatc 
tcattgcgct gccattctcc 
atgtcgtcgt gcacaacaat 
gaagccgaag tttccaaaag 
acggtcaccg taaccagcaa 
gagccgtaca aatgtacggc 
acctctgata gttgagttga 
ggtgtcatgg ctgtttgtgg 
ttcgctccca gaaatatagc 
cattctcatt gaacgacggc 
gaagttccta ttctcaagaa 

<210> 3 
<211> 1070 
<212> DNA 
<213> Ktinstliche Sequenz 

<220> 

<223> Beschreibung der kiinstlichen Sequenz: insert of 
vector pCB4 01-20 

<400> 3 

gagctctgat cacggaagat agctttggca aaaaaagcaa aaagcattta ccttgattga 60 

gatgttaatt gtgttggcaa ttatcagtat tttaattttg ctttttgtgc caaatttgat 120 

actagagctt cgggtgccag ggcgtgccct tgggctcccc gggcgcgtac tcgacgctac 180 

cttaagagag tcaagcttct atattaccct gttatcccta gcgtactcga gctgcagtta 240 

tttgccaact accttagtga tctcgccttt cacgtagtgg acaaattctt ccaactgatc 300 

tgcgcgcgag gccaagcgat cttcttcttg tccaagataa gcctgtctag cttcaagtat 360 

gacgggctga tactgggccg gcaggcgctc cattgcccag tcggcagcga catccttcgg 420 

cgcgattttg ccggttactg cgctgtacca aatgcgggac aacgtaagca ctacatttcg 480 

ctcatcgcca gcccagtcgg gcggcgagtt ccatagcgtt aaggtttcat ttagcgcctc 540 

aaatagatcc tgttcaggaa ccggatcaaa gagttcctcc gccgctggac ctaccaaggc 600 

aacgctatgt tctcttgctt ttgtcagcaa gatagccaga tcaatgtcga tcgtggctgg 660 

ctcgaagata cctgcaagaa tgtcattgcg ctgccattct ccaaattgca gttcgcgctt 720 

agctggataa cgccacggaa tgatgtcgtc gtgcacaaca atggtgactt ctacagcgcg 780 

gagaatctcg ctctctccag gggaagccga agtttccaaa aggtcgttga tcaaagctcg 840 



agctttggca aaaaaagcaa aaagcattta ccttgattga 60. 
ttatcagtat tttaattttg ctttttgtgc caaatttgat 120 
ggcgtgccct tgggctcccc gggcgcgtac tcgacgctac 180 
atattaccct gttatcccta gcgtactcga gaaaaaaaga 240 
tgatagaaca agaaaatgat tattgctcct ttcttttcaa 300 
aggaattatc tgcagttatt tgccaactac cttagtgatc 360 
aaattcttcc aactgatctg cgcgcgaggc caagcgatct 420 
ctgtctagct tcaagtatga cgggctgata ctgggccggc 480 
ggcagcgaca tccttcggcg cgattttgcc ggttactgcg 540 
cgtaagcact acatttcgct catcgccagc ccagtcgggc 600 
ggtttcattt agcgcctcaa atagatcctg ttcaggaacc 660 
cgctggacct accaaggcaa cgctatgttc tcttgctttt 720 
aatgtcgatc gtggctggct cgaagatacc tgcaagaatg 780 
aaattgcagt tcgcgcttag ctggataacg ccacggaatg 840 
ggtgacttct acagcgcgga gaatctcgct ctctccaggg 900 
gtcgttgatc aaagctcgcc gcgttgtttc atcaagcctt 960 
atcaatatca ctgtgtggct tcaggccgcc atccactgcg 1020 
cagcaacgtc ggttcgagat ggcgctcgat gacgccaact 1080 
tacttcggcg ataaccgctt cacgagccat ggctgtttgt 1140 
tgtcatgaat ccctccctac aactagatcc tcgcccggag 1200 
catccctgcc ccctcacgtc aatcccacga gcctcttatc 1260 
gtcgaggggg ggcccggtac gtcgacgaag ttcctattcc 1320 
agtataggaa cttcgtacc 1359 



1 



WO 03/054189 PCT/EP02/14302 

4 

ccgcgttgtt tcatcaagcc ttacggtcac cgtaaccagc aaatcaatat cactgtgtgg 900 
cttcaggccg ccatccactg cggagccgta caaatgtacg gccagcaacg tcggttcgag 960 
atggcgctcg atgacgccaa ctacctctga tagttgagtt gatacttcgg cgataaccgc 1020 
ttcacgagcc atggttccct ccctacaacg tcgagggggg gcccggtacc 1070 

<210> 4 
<211> 804 
<212> DNA 

<213> Kiinstliche Sequenz 
<220> 

<223> Beschreibung der kiinstlichen Sequenz: insert of 
vector pCB289-13 

<220> 

<221> CDS 

<222> (154) (642) 

<223> sequence coding for I-Ppol homing-endonuclease 
<400> 4 

ggtaccgggc cccccctcga cgccgtcgtt caatgagaat ggataagagg ctcgtgggat 60 

tgacgtgagg gggcagggat ggctatattt ctgggagcga actccgggcg aggatctagt 120 

tgtagggagg gattcatgac accacaaaca gcc atg gcg etc acc aat get caa 174 

Met Ala Leu Thr Asn Ala Gin 
1 5 

ate ttg get gtg att gac agt tgg gaa gaa aca gtc ggt cag ttt cca 222 
lie Leu Ala Val He Asp Ser Trp Glu Glu Thr Val Gly Gin Phe Pro 
10 15 20 

gtg ata acg cac cat gta cca tta ggt ggc ggt ctg caa gga acg etc 270 
Val He Thr His His Val Pro Leu Gly Gly Gly Leu Gin Gly Thr Leu 

25 30 35 

cat tgt tac gag ate ccc eta gca get cct tat ggg gtt ggc ttt get 318 
His Cys Tyr Glu He Pro Leu Ala Ala Pro Tyr Gly Val Gly Phe Ala 
40 45 50 55 

aag aat ggg cct acc cgc tgg caa tac aaa egg aca ate aat caa gtc 366 
Lys Asn Gly Pro Thr Arg Trp Gin Tyr Lys Arg Thr He Asn Gin Val 
60 65 70 

gtc cac aga tgg ggg tec cac aca gtc cct ttt eta tta gaa ccg gat 414 
Val His Arg Trp Gly Ser His Thr Val Pro Phe Leu Leu Glu Pro Asp 
75 80 85 

aac ate aac ggc aaa acc tgc aca gca teg cac eta tgt cat aat act 
Asn He Asn Gly Lys Thr Cys Thr Ala Ser His Leu Cys His Asn Thr 
90 " 95 100 



462 



cga tgc cac aat ccc ttg cac ttg tgc tgg gag tea eta gac gac aac 510 
Arg Cys His Asn Pro Leu His Leu Cys Trp Glu Ser Leu Asp Asp Asn 

105 110 H5 

aaa ggc aga aac tgg tgc ccc ggt ccc aac ggg gga tgt gtc cat gcg 558 
Lys Gly Arg Asn Trp Cys Pro Gly Pro Asn Gly Gly Cys Val His Ala 
120 " 125 130 135 

gtg gtt tgt tta agg cag ggt ccg ttg tac ggc cca ggg gcg act gtg 606 
Val Val Cys Leu Arg Gin Gly Pro Leu Tyr Gly Pro Gly Ala Thr Val 
140 145 150 

gca ggt cct caa caa agg ggc agt cac ttt gtg gta taactgeaga 652 
Ala Gly Pro Gin Gin Arg Gly Ser His Phe Val Val 
155 160 



WO 03/054189 PCT/EP02/14302 

5 

agcttcaatt gcatgctcta gatgatcaaa gaattcctgg cctagtctat aggaggtttt 712 

gaaaagaaag gagcaataat cattttcttg ttctatcaag agggtgctat tgctcctttc 772 

tttttttctc gagaggggta cgtaccgagc tc 804 

<210> 5 
<211> 163 
<212> PRT 

<213> Kunstliche Sequenz 

<223> Beschreibung der kunstlichen Sequenz: insert of 
vector pCB2 89-13 

<400> 5 

Met Ala Leu Thr Asn Ala Gin lie Leu Ala Val lie Asp Ser Trp Glu 
15 10 15 

Glu Thr Val Gly Gin Phe Pro Val lie Thr His His Val Pro Leu Gly 
20 25 30 

Gly Gly Leu Gin Gly Thr Leu His Cys Tyr Glu lie Pro Leu Ala Ala 
35 40 45 

Pro Tyr Gly Val Gly Phe Ala Lys Asn Gly Pro Thr Arg Trp Gin Tyr 
50 55 60 

Lys Arg Thr He Asn Gin Val Val His Arg Trp Gly Ser His Thr Val 
65 70 75 80 

Pro Phe Leu Leu Glu Pro Asp Asn He Asn Gly Lys Thr Cys Thr Ala 
85 90 95 

Ser His Leu Cys His Asn Thr Arg Cys His Asn Pro Leu His Leu Cys 
100 105 110 

Trp Glu Ser Leu Asp Asp Asn Lys Gly Arg Asn Trp Cys Pro Gly Pro 
115 120 125 

Asn Gly Gly Cys Val His Ala Val Val Cys Leu Arg Gin Gly Pro Leu 
130 135 140 

Tyr Gly Pro Gly Ala Thr Val Ala Gly Pro Gin Gin Arg Gly Ser His 
145 150 155 160 

Phe Val Val 



<210> 6 
<211> 1150 
<212> DNA 

<213> Kiinstliche Sequenz 
<220> 

<223> Beschreibung der kunstlichen Sequenz: 

Xhol / Bgl II fragment for construction of 
vector pCB304-25 

<400> 6 

ctcgagtatt cggctcaatc cttttagtaa aagattgggc cgagtttaat tgcaattcaa 60 

ttaagagaac gaaggataat tacttgagtt ctttctcctt atccttcttt atttcctgct 120 

aatttatctg ctaatgtcta ctgaattcaa gcttggatcc gcggccgcct agcttgggtc 180 

ccgctcagaa gaactcgtca agaaggcgat agaaggcgat gcgctgcgaa tcgggagcgg 240 

cgataccgta aagcacgagg aagcggtcag cccattcgcc gccaagctct tcagcaatat 300 

cacgggtagc caacgctatg tcctgatagc ggtccgccac acccagccgg ccacagtcga 360 

tgaatccaga aaagcggcca ttttccacca tgatattcgg caagcaggca tcgccatggg 420 
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tcacgacgag atcctcgccg tcgggcatgc gcgccttgag cctggcgaac agttcggctg 480 
gcgcgagccc ctgatgctct tcgtccagat catcctgatc gacaagaccg gcttccatcc 540 
gagtacgtgc tcgctcgatg cgatgtttcg cttggtggtc gaatgggcag gtagccggat 600 
caagcgtatg cagccgccgc attgcatcag ccatgatgga tactttctcg gcaggagcaa 660 
ggtgagatga caggagatcc tgccccggca cttcgcccaa tagcagccag tcccttcccg 720 
cttcagtgac aacgtcgagc acagctgcgc aaggaacgcc cgtcgtggcc agccacgata 780 
gccgcgctgc ctcgtcctgc agttcattca gggcaccgga caggtcggtc ttgacaaaaa 840 
gaaccgggcg cccctgcgct gacagccgga acacggcggc atcagagcag ccgattgtct 900 
gttgtgccca gtcatagccg aatagcctct ccacccaagc ggccggagaa cctgcgtgca 960 
atccatcttg ttcaatccaa gctcccatgg ctgtttgtgg tgtcatgaat ccctccctac 1020 
aactagatcc tatatactat agagataggt ggataaatat ttttctttag taagacccca 1080 
tcgctaatat taatttatct aacatattaa ttaatattta atatataaat atatatagag 1140 
tcgagatcta H50 

<210> 7 
<211> 454 
<212> DNA 

<213> Kunstliche Sequenz 
<220> 

<223> Beschreibung der ktiristlichen Sequenz: insert of 
vector pCB220-17 

<400> 7 

gaagacgatc ctaaatagca atatttacct ttgggaccaa aagttatcag gcatgcacct 60 
ggtagctagt ctttaaacca atagattgca tcggtttaaa aggcaagacc gtcaaattgc 120 
gggaaagggg tcaacagccg ttcagtacca agtctcaggg gaaactttga gatggccttg 180 
caaagggtat ggtaataagc tgacggacat ggtcctaacc acgcagccaa gtcctaagtc 240 
aacagatctt ctgttgatat ggatgcagtt cacagactaa atgtcggtcg gggaagatgt 300 
attcttctca taagatatag tcggacctct ccttaatggg agctagcgga tgaagtgatg 360 
caacactgga gccgctggga actaatttgt atgcgaaagt atattgatta gttttggagt 420 
actcgaaggt agcgaaattc cttgtcaagt cttc 45 4 

<210> 8 

<211> 498 

<212> DNA 

<213> Kunstliche Sequenz 
<220> 

<223> Beschreibung der Jctinstlichen Sequenz: insert of 
vector pCB270-l 

<400> 8 

gcgcgcgtaa tacgactcac tatagggcga attgggggcg actgtttacc aaaaacacag 60 
gtctccgcaa agtcgtaaga ccatgtatgg gggctgacgc ctgcccagtg ccggaaggtc 120 
aaggaagttg gtgacctgat gacaggggag ccggcgaccg aagccccggt gaacggcggc 180 
cgtaactata acggtcctaa gtcttcgaat cgaattcact agtgatagga agaccttgtc 240 
gggtaagttc cgacccgcac gaaaggcgta acgatctggg cactgtctcg gagagaggct 300 
cggtgaaata gacatgtctg tgaagatgcg gactacctgc acctggacag agagacccca 360 
attcctggcc tagtctatag gaggttttga aaagaaagga gcaataatca ttttcttgtt 420 
ctatcaagag ggtgctattg ctcctttctt tttttctcga ccagcttttg ttccctttag 480 
tgagggttaa ttgcgcgc 498 

<210> 9 
<211> 789 
<212> DNA 

<213> Kunstliche Sequenz 
<220> 

<223> Beschreibung der kttnstlichen Sequenz: lacZ gene 
with inserted intron to demonstrate spleissing 
(from vector pCB315-l) 



WO 03/054189 



7 



PCTYEP02/14302 



<400> 9 

acaatttcca ttcgccattc aggctgcgca actgttggga agggcgatcg gtgcgggcct 60 

cttcgctatt acgccagctg gcgaaagggg gatgtgctgc aaggcgatta agttgggtaa 120 

cgccagggtt ttcccagtca cgacgttgta aaacgacggc cagtgagcgc gcgtaatacg 180 

actcactata gggcgaattg ggtaccgggc cccccctcga ggtcgacggt atcgataagc 240 

ttgacccgac aaggaatttc gctaccttcg agtactccaa aactaatcaa tatactttcg 300 

catacaaatt agttcccagc ggctccagtg ttgcatcact tcatccgcta gctcccatta 360 

aggagaggtc cgactatatc ttatgagaag aatacatctt ccccgaccga catttagtct 420 

gtgaactgca tccatatcaa cagaagatct gttgacttag gacttggctg cgtggttagg 480 

accatgtccg tcagcttatt accataccct ttgcaaggcc atctcaaagt ttcccctgag 540 

acttggtact gaacggctgt tgaccccttt cccgcaattt gacggtcttg ccttttaaac 600 

cgatgcaatc tattggttta aagactagct accaggtgca tgcctgataa cttttggtcc 660 

caaaggtaaa tattgctatt taggaccgtt aggatccact agttctagag cggccgccac 720 

cgcggtggag ctccagcttt tgttcccttt agtgagggtt aattgcgcgc ttggcgtaat 780 
catggtcat 789 

<210> 10 
<211> 2566 
<212> DNA 

<213> Kunstliche Sequenz 
<220> 

<223> Beschreibung der kiinstlichen Sequenz: Ll.LtrB 
intron from vector pCB345-34. 

<400> 10 

gaattcgccc tttgaagact tgacatttga tatggtgaag tagggaggta ccgccttgtt 60 
cacattactg tgactggttt gcaccaccct cttcgggaac cgtacgtacc cctctcggag 120 
tatacggctc tgttattgtt cgttcgtaaa aattcacttg tgtttatgaa tcacgtgacg 180 
atgacaatga aagcatacaa caagagtttt acgttgtttc gctatcattg ccatttccca 240 
tttttctttg cctttaagat ttttgacctt attgacatgg tgaatttcat aggaagtatt 300 
ttcatcagat gttccacata attcacaaca tttagctttt aacctgtttt caagagtatt 360 
ccgggcatag ccatacaata caggagcttg acttatctta tccgtaaatt gataagggga 420 
tttacattca ctaaaatttg caaaataacg gcgctgctta ccttgcttta tctcatacgg 480 
gatgccccac gaaccacttc catctttaaa catggaaatg gtttttgaaa gtgttccctt 540 
atgtttggag gctatcgttt ttagacagct gtattccata agataagcaa aataattgag 600 
ctggttaaaa ttacttgcta gaccgtagta attacaaatc cctcttaatt cagaattata 660 
aattgtgatg atttctaagt ctgttgaacg aataagatat ttcctgtgaa ctggaaacca 720 
tgagctatct ttcttttgga tagctatttt cttgtcaaaa ataaattgac gaattttgtc 780 
ttgaagagga ataaggagtt ctacactccc attgagtgtt ctctttttga ctttaccaga 840 
tcgttttatc gttccacttc tccttactcg tatatcatat cccagaaaac gagcgggttg 900 
actgctatgt gtgatgagtg ttttttcttc actcaattcc atttttagct tgttatgaat 960 
aaaaagtttt aattgttctt ttatccattg acagtcctct ttgcttcctt taacagagat 1020 
aatgaagtcg tccgcatacc ggacgtattt caatacttta tttgtctgtg aggtacaggg 1080 
gagtgtgggt aatcttttac gtttttcttg atattctaaa agaactttag ctttttcttc 1140 
accctccaac ttcttgagac ggtgagaaat tctttttatc tcattgtgaa gttcccgata 1200 
ttcaggtgtt attctttctg gactttctcg gtcaaacttc attttgagtt gtaaaacaaa 1260 
cttatccaat tcatgaagat agatgttggc caaaagagga gatagaattc caccttgagg 1320 
tgttccgctg taagttttgt gatactgcca gttttccaga taacctgctt ttagaaattt 1380 
ataaatcaat tggctcattt tcatatcttt gattttaaga ttgatgagtc caatgagtgt 1440 
aacgtggtct atattatcga agcagccttt tatatctccc tccacaaacc atcttgcgcc 1500 
gccaaactct cttttgattg ttttcaaagc cgtgtgacag cttcgttgag gtctaaaacc 1560 
gtgagacaca tcttcgaata ccggttcata gatagattca agaattattc tcacagcttc 1620 
ttggatcaat ttatctgtga aagttggaat tcctaaaggt ctcatctttt tagaattctt 1680 
ttttgcaata tacattcttc gtacaggttg aggatagtaa gttccgtctt ttaaagattg 1740 
aataatcttt tttatttttt cttcactaaa gccatccgct gtatcatcta atattccttt 1800 
tgtggaagct cctttattgg aatataaatt ttgatacgcc acgtaataaa tatctggacg 1860 
taaaagataa cgataaagtc ttgtaaaaac ttcgtctata ttttcttgtg aatttttact 1920 
gattctttct aaaattgcca ttgttggttt cattttgagg ttttcctccc taatcaattt 1980 
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ttaattttag tacacaataa ctgtacccct ttgccatgta aagggcgtta cccttctcag 2040 

actactacga gtactccgta cccttgcaag attttcaagc tctagtgcta tagccttttt 2100 

cctcctttct attaggcatt cttgtttagg gtatccccag ttagtgttaa gtcttggtaa 2160 

attcagattc tcggcatcgc tttcgtttcg ttcccatagg ttctcctaca gattgtacaa 2220 

atgtggtgat aacagataag tccacaacca taacttacct ttctttgtac tagaggtttc 2280 

agacactttc ctctatcgac acataaccga aattagaaac ttgckttcag taaacacaac 2340 

ttatacctta tatctgatta acattgcgac tcagtcgtac ccgattgtct ttaggtaact 2400 

catcgctttc caaccgtgct ctgttcccgt atcagctttc gcttttcggt taggttggct 2460 

gttttctgtg ttatcttaca gagtagtacc ttaaactact tgacttaaca ccctatctgg 2520 

gcgcacgtta tggatgtgtt aggaatgtct tctcaagggc gaattc 2566 

<210> 11 
<211> 520 
<212> DNA 

<213> Kiinstliche Sequenz 
<220> 

<223> Beschreibung der kiinstlichen Sequenz: synthetic 
sequence coding for I-Ppo I homing-endonuclease 

<220> 

<221> CDS 

<222> (16) . . (504) 

<400> 11 

gcatatgaga tctcc atg gcg etc acc aat get caa ate ttg get gtg att 51 
Met Ala Leu Thr Asn Ala Gin He Leu Ala Val He 
15 10 

gac agt tgg gaa gaa aca gtc ggt cag ttt cca gtg ata acg cac cat 99 
Asp Ser Trp Glu Glu Thr Val Gly Gin Phe Pro Val He Thr His His 
15 20 25 

gta cca tta ggt ggc ggt ctg caa gga acg etc cat tgt tac gag ate 147 
Val Pro Leu Gly Gly Gly Leu Gin Gly Thr Leu His Cys Tyr Glu He 
30 35 40 

ccc eta gca get cct tat ggg gtt ggc ttt get aag aat ggg cct acc 195 
Pro Leu Ala Ala Pro Tyr Gly Val Gly Phe Ala Lys Asn Gly Pro Thr 
45 50 55 60 

cgc tgg caa tac aaa egg aca ate aat caa gtc gtc cac aga tgg ggg 243 
Arg Trp Gin Tyr Lys Arg Thr He Asn Gin Val Val His Arg Trp Gly 
65 70 75 

tec cac aca gtc cct ttt eta tta gaa ccg gat aac ate aac ggc aaa 291 
Ser His Thr Val Pro Phe Leu Leu Glu Pro Asp Asn He Asn Gly Lys 
80 85 90 

acc tgc aca gca teg cac eta tgt cat aat act cga tgc cac aat ccc 339 
Thr Cys Thr Ala Ser His Leu Cys His Asn Thr Arg Cys His Asn Pro 
95 100 105 

ttg cac ttg tgc tgg gag tea eta gac gac aac aaa ggc aga aac tgg 387 
Leu His Leu Cys Trp Glu Ser Leu Asp Asp Asn Lys Gly Arg Asn Trp 
110 115 120 

tgc ccc ggt ccc aac ggg gga tgt gtc cat gcg gtg gtt tgt tta agg 435 
Cys Pro Gly Pro Asn Gly Gly Cys Val His Ala Val Val Cys Leu Arg 
125 130 135 140 

cag ggt ccg ttg tac ggc cca ggg gcg act gtg gca ggt cct caa caa 483 
Gin Gly Pro Leu Tyr Gly Pro Gly Ala Thr Val Ala Gly Pro Gin Gin 
145 150 155 
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agg ggc agt cac ttt gtg gta taactgcagc tcgagg 520 
Arg Gly Ser His Phe Val Val 
160 

<210> 12 
<211> 163 
<212> PRT 

<213> Kiinstliche Sequenz 

<223> Beschreibung der kiinstlichen Sequenz: synthetic 
sequence coding for I-Ppo I homing-endonuclease 

<400> 12 

Met Ala Leu Thr Asn Ala Gin He Leu Ala Val He Asp Ser Trp Glu 
15 10 15 

Glu Thr Val Gly Gin Phe Pro Val He Thr His His Val Pro Leu Gly 
20 25 30 

Gly Gly Leu Gin Gly Thr Leu His Cys Tyr Glu He Pro Leu Ala Ala 
35 40 45 

Pro Tyr Gly Val Gly Phe Ala Lys Asn Gly Pro Thr Arg Trp Gin Tyr 
50 55 60 

Lys Arg Thr lie Asn Gin Val Val His Arg Trp Gly Ser His Thr Val 
65 70 75 80 

Pro Phe Leu Leu Glu Pro Asp Asn He Asn Gly Lys Thr Cys Thr Ala 
85 90 95 

Ser His Leu Cys His Asn Thr Arg Cys His Asn Pro Leu His Leu Cys 
100 105 110 

Trp Glu Ser Leu Asp Asp Asn Lys Gly Arg Asn Trp Cys Pro Gly Pro 
115 120 125 

Asn Gly Gly Cys Val His . Ala Val Val Cys Leu Arg Gin Gly Pro Leu 
130 135 140 

Tyr Gly Pro Gly Ala Thr Val Ala Gly Pro Gin Gin Arg Gly Ser His 
145 150 155 160 

Phe Val Val 



<210> 13 
<211> 481 
<212> DNA 

<213> Chlamydomonas pallidostigmatica 

<220> 
<221> CDS 
<222> (4).- (459) 

<223> ORF coding for I-Cpa I homing endonuclease 
<400> 13 

acc atg gac att aat cct caa tgg att aca ggt ttc gta gat ggg gaa 48 
Met Asp He Asn Pro Gin Trp He Thr Gly Phe Val Asp Gly Glu 
15 10 15 

ggt tgt ttt agt gta agt ata ctt aga aat aat teg ttg cgc tat ggc 96 
Gly Cys Phe Ser Val Ser He Leu Arg Asn Asn Ser Leu Arg Tyr Gly 
20 25 30 

cat cag ctt caa cca gaa ttc gta gtg acc caa cat aaa tta gat gca 144 
His Gin Leu Gin Pro Glu Phe Val Val Thr Gin His Lys Leu Asp Ala 
35 40 45 
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aat gtt tta tat gca tta aaa gac tac ttt aaa gtt gga tea gtc gtt 192 
Asn Val Leu Tyr Ala Leu Lys Asp Tyr Phe Lys Val Gly Ser Val Val 
50 55 60 

gtg aat cat ggg gaa egg ctt tgc tat aaa gtc aaa aat att gat cac 240 
Val Asn His Gly Glu Arg Leu Cys Tyr Lys Val Lys Asn lie Asp His 
65 70 75 

ttt ata acc gtc att ata cca ttt ttc gaa aaa cat gag eta aaa aca 288 
Phe lie Thr Val He He Pro Phe Phe Glu Lys His Glu Leu Lys Thr 
80 85 90 95 

aaa aga aga att gaa ttt ctt cga ttt cga aaa ate tgc ttg ctg tta 336 
Lys Arg Arg He Glu Phe Leu Arg Phe Arg Lys He Cys Leu Leu Leu 
100 105 110 

aaa gca ggt aga cat tta gaa teg cag gaa gga ttc gag aaa gtg ttg 384 
Lys Ala Gly Arg His Leu Glu Ser Gin Glu Gly Phe Glu Lys Val Leu 
115 120 125 

gat tta gca aaa aaa etc cgt ate aat gag aaa aac tac cag gaa tct 432 
Asp Leu Ala Lys Lys Leu Arg He Asn Glu Lys Asn Tyr Gin Glu Ser 
130 135 140 

ate aaa cgt ttt gaa gaa act ggc gag taactcgaga gtatagagct cc 481 
He Lys Arg Phe Glu Glu Thr Gly Glu 
145 150 

<210> 14 
<211> 152 
<212> PRT 

<213> Chlamydomonas pallidostigmatica 
<400> 14 

Met Asp He Asn Pro Gin Trp He Thr Gly Phe Val Asp Gly Glu Gly 
15 10 15 

Cys Phe Ser Val Ser He Leu Arg Asn Asn Ser Leu Arg Tyr Gly His 
20 25 30 

Gin Leu Gin Pro Glu Phe Val Val Thr Gin His Lys Leu Asp Ala Asn 
35 40 45 

Val Leu Tyr Ala Leu Lys Asp Tyr Phe Lys Val Gly Ser Val Val Val 
50 55 60 

Asn His Gly Glu Arg Leu Cys Tyr Lys Val Lys Asn He Asp His Phe 
65 70 75 80 

He Thr Val He He Pro Phe Phe Glu Lys His Glu Leu Lys Thr Lys 
85 90 95 

Arg Arg lie Glu Phe Leu Arg Phe Arg Lys He Cys Leu Leu Leu Lys 
100 105 110 

Ala Gly Arg His Leu Glu Ser Gin Glu Gly Phe Glu Lys Val Leu Asp 
115 120 125 

Leu Ala Lys Lys Leu Arg He Asn Glu Lys Asn Tyr Gin Glu Ser He 
130 135 140 

Lys Arg Phe Glu Glu Thr Gly Glu 
145 150 



<210> 15 
<211> 917 
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<212> DNA 

<213> Chlamydomonas pallidostigmatica 
<220> 

<221> intron 
<222> (18).. (893) 
<223> CPLSU2 Intron 

<400> 15 

gaagacgatc ctaaggttaa ttgctagctt tagtaaaact gaactatatg ctggaaaatc 60 
ctcgggcctc ttctttcccc agttgcactt cgtgctaaag cgggcagatg aaactataaa 120 
gcaaaaagag gctcatcact tttttttacc ggaactccgt tccggcttaa agtgatgaaa 180 
aagatgtctt gtacgtctcg tattttgcca cgagccgtga taatcaagcg tacatgggga 240 
caatcagcag ggaaggatgt ttgatacacg cagagtagaa ctggcagtct agaatcggtc 300 
ggtatcgcta aacataaccc tcagagacta tacgttcgga agtcttaata atcataataa 360 
taggaggaaa ttgaaaatgg acattaatcc tcaatggatt acaggtttcg tagatgggga 420 
aggttgtttt agtgtaagta tacttagaaa taattcgttg cgctatggcc atcagcttca 480 
accagaattc gtagtgaccc aacataaatt agatgcaaat gttttatatg cattaaaaga 540 
ctactttaaa gttggatcag tcgttgtgaa tcatggggaa cggctttgct ataaagtcaa 600 
aaatattgat cactttataa ccgtcattat accatttttc gaaaaacatg agctaaaaac 660 
aaaaagaaga attgaatttc ttcgatttcg aaaaatctgc ttgctgttaa aagcaggtag 720 
acatttagaa tcgcaggaag gattcgagaa agtgttggat ttagcaaaaa aactccgtat 780 
caatgagaaa aactaccagg aatctatcaa acgttttgaa gaaactggcg agtaaaaaaa 840 
ataagattta agatagagtc cagcctattt tgaagaaaaa tggggtaaat ctgagcgaaa 900 
ttccttgtca agtcttc 917 

<210> 16 
<211> 21 
<212> DNA 

<213> Kunstliche Sequenz 
<220> 

<223> Beschreibung der ktinstlichen Sequenz: 
oligonucleotide primer 

<400> 16 

taaggccctc ggtagcaacg g 21 

<210> 17 
<211> 20 
<212> DNA 

<213> Kunstliche Sequenz 
<220> 

<223> Beschreibung der kiinstlichen Sequenz: 
oligonucleotide primer 

<400> 17 

ggggtaccaa atccaactag 20 

<210> 18 
<211> 25 
<212> DNA 

<213> Kiinstliche Sequenz 
<220> 

<223> Beschreibung der kiinstlichen Sequenz: 
oligonucleotide primer 

<400> 18 

ggagctcgct cccccgccgt cgttc 25 

<210> 19 
<211> 27 
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<212> DNA 

<213> Kunstliche Sequenz 
<220> 

<223> Beschreibung der kunstlichen Sequenz: 
oligonucleotide primer 

<400> 19 

gatgcatgat gacttgacgg catcctc 

<210> 20 
<211> 16 
<212> DNA 

<213> Kunstliche Sequenz 
<220> 

<223> Beschreibung der kunstlichen Sequenz: 
oligonucleotide primer 

<400> 20 

gtcgacagat ctttaa 

<210> 21 
<211> 16 
<212> DNA 

<213> Kunstliche Sequenz 
<220> 

<223> Beschreibung der kunstlichen Sequenz: 
oligonucleotide primer 

<400> 21 

agatctgtcg acttaa 

<210> 22 
<211> 22 
<212> DNA 

<213> Kunstliche Sequenz 

<220> , 
<223> Beschreibung der kunstlichen Sequenz: 
oligonucleotide primer 

<400> 22 

gatctccagt taactggggt ac 

<210> 23 
<211> 14 
<212> DNA 

<213> Kunstliche Sequenz 
<220> 

<223> Beschreibung der kunstlichen Sequenz: 
oligonucleotide primer 

<400> 23 
cccagttaac tgga 

<210> 24 
<211> 25 
<212> DNA 

<213> Kunstliche Sequenz 
<220> 

<223> Beschreibung der kunstlichen Sequenz: 
oligonucleotide primer 
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<400> 24 

ttaagccagt taactgggcg gagct 

<210> 25 
<211> 17 
<212> DNA 

<213> Kiinstliche Sequenz 
<220> 

<223> Beschreibung der kiinstlichen Sequenz: 
oligonucleotide primer 

<400> 25 

ccgcccagtt aactggc 

<210> 26 
<211> 34 
<212> DNA 

<213> Kiinstliche Sequenz 
<220> 

<223> Beschreibung der kiinstlichen Sequenz: 
oligonucleotide primer 

<400> 26 

tcgagaagat cagcctgtta tccctagagt aact 

<210> 27 
<211> 34 
<212> DNA 

<213> Kunstliche Sequenz 
<220> 

<223> Beschreibung der kiinstlichen Sequenz: 
oligonucleotide primer 

<400> 27 

ctagagttac tctagggata acaggctgat cttc 

<210> 28 

<211> 17 

<212> DNA 

<213> Kunstliche Sequenz 
<220> 

<223> Beschreibung der kiinstlichen Sequenz: 
oligonucleotide primer 

<400> 28 

agaagacgat cctaagg 

<210> 29 
<211> 23 
<212> DNA 

<213> Kiinstliche Sequenz 
<220> 

<223> Beschreibung der kiinstlichen Sequenz: 
oligonucleotide primer 

<400> 29 

tgaagacttg acaaggaatt teg 

<210> 30 
<211> 56 
<212> DNA 

<213> Kiinstliche Sequenz 
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<220> 

<223> Beschreibung der kiinstlichen Sequenz: 
oligonucleotide primer 

<400> 30 

agaagacgat cctaaatagc aatatttacc tttgggacca aaagttatca ggcatg 56 

<210> 31 
<211> 50 
<212> DNA 

<213> Kiinstliche Sequenz 
<220> 

<223> Beschreibung der kiinstlichen Sequenz: 
oligonucleotide primer 

<400> 31 

tgaagacttg acaaggaatt tcgctacctt cgagtactcc aaaactaatc 50 

<210> 32 
<211> 33 
<212> DNA 

<213> Kiinstliche Sequenz 
<220> 

<223> Beschreibung der kiinstlichen Sequenz: 
oligonucleotide primer 

<400> 32 

gagaagacat tcctaacaca tccataacgt gcg 33 

<210> 33 

<211> 32 

<212> DNA 

<213> Kiinstliche Sequenz 
<220> 

<223> Beschreibung der kiinstlichen Sequenz: 
oligonucleotide primer 

<400> 33 

tgaagacttg acatttgata tggtgaagta gg 32 

<210> 34 

<211> 175 

<212> DNA 

<213> Pisum sativum 

<220> 

<221> CDS 

<222> (1) . . (174) 

<223> plastid translocalization sequence 
<400> 34 

atg get tct atg ata tec tct tea get gtg act aca gtc age cgt get 48 
Met Ala Ser Met lie Ser Ser Ser Ala Val Thr Thr Val Ser Arg Ala 
15 10 15 

tct acg gtg caa teg gee gcg gtg get cca ttc ggc ggc etc aaa tec 96 
Ser Thr Val Gin Ser Ala Ala Val Ala Pro Phe Gly Gly Leu Lys Ser 

20 25 30 

atg act gga ttc cca gtt aag aag gtc aac act gac att act tec att 144 
Met Thr Gly Phe Pro Val Lys Lys Val Asn Thr Asp He Thr Ser He 

35 40 45 

aca age aat ggt gga aga gta aag tgc atg c 175 
Thr Ser Asn Gly Gly Arg Val Lys Cys Met 
50 55 
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<210> 35 
<211> 58 
<212> PRT 

<213> Pisum sativum 
<400> 35 

Met Ala Ser Met lie Ser Ser Ser Ala Val Thr Thr Val Ser Arg Ala 
15 10 15 

Ser Thr Val Gin Ser Ala Ala Val Ala Pro Phe Gly Gly Leu Lys Ser 
20 25 30 

Met Thr Gly Phe Pro Val Lys Lys Val Asn Thr Asp lie Thr Ser lie 
35 40 45 

Thr Ser Asn Gly Gly Arg Val Lys Cys Met 
50 55 



<210> 36 
<211> 84 
<212> PRT 

<213> Nicotiana tabacum 
<220> 

<221> TRANSIT 
<222> (1) . . (84) 

<223> plastidic translocalisation signal derived from 
plastidic transketolase 

<400> 36 

Met Ala Ser Ser Ser Ser Leu Thr Leu Ser Gin Ala He Leu Ser Arg 
15 10 15 

Ser Val Pro Arg His Gly Ser Ala Ser Ser Ser Gin Leu Ser Pro Ser 
20 25 30 

Ser Leu Thr Phe Ser Gly Leu Lys Ser Asn Pro Asn He Thr Thr Ser 
35 40 45 

Arg Arg Arg Thr Pro Ser Ser Ala Ala Ala Ala Ala Val Val Arg Ser 
50 55 60 

Pro Ala He Arg Ala Ser Ala Ala Thr Glu Thr He Glu Lys Thr Glu 
65 70 75 80 

Thr Ala Gly Ser 

<210> 37 
<2H> 258 
<212> DNA 

<213> Nicotiana tabacum 
<220> 

<221> transit_peptide 
<222> (1) . . (258) 

<223> plastidic translocalisation signal derived from 
plastidic transketolase (frame 1) 

<400> 37 

ggtaccatgg cgtcttcttc ttctctcact ctctctcaag ctatcctctc tcgttctgtc 60 

cctcgccatg gctctgcctc ttcttctcaa ctttcccctt cttctctcac tttttccggc 120 

cttaaatcca atcccaatat caccacctcc cgccgccgta ctccttcctc cgccgccgcc 180 

gccgccgtcg taaggtcacc ggcgattcgt gcctcagctg caaccgaaac catagagaaa 240 

actgagactg cgggatcc 258 
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<210> 38 
<211> 260 
<212> DNA 

<213> Nicotiana tabacum 
<220> 

<221> transit_peptide 
<222> (1)..(260) 

<223> plastidic translocalisation signal derived from 
plastidic transketolase (frame 2) 

<400> 38 

ggtaccatgg cgtcttcttc ttctctcact ctctctcaag ctatcctctc tcgttctgtc 60 
cctcgccatg gctctgcctc ttcttctcaa ctttcccctt cttctctcac tttttccggc 120 
cttaaatcca atcccaatat caccacctcc cgccgccgta ctccttcctc cgccgccgcc 180 
gccgccgtcg taaggtcacc ggcgattcgt gcctcagctg caaccgaaac catagagaaa 240 
actgagactg cgctggatcc 260 

<210> 39 
<211> 259 
<212> DNA 

<213> Nicotiana tabacum 
<220> 

<221> transit_peptide 
<222> (1) . . (259) 

<223> plastidic translocalisation signal derived from 
plastidic transketolase (frame 3) 

<400> 39 

ggtaccatgg cgtcttcttc ttctctcact ctctctcaag ctatcctctc tcgttctgtc 60 

cctcgccatg gctctgcctc ttcttctcaa ctttcccctt cttctctcac tttttccggc 120 

cttaaatcca atcccaatat caccacctcc cgccgccgta ctccttcctc cgccgccgcc 180 

gccgccgtcg taaggtcacc ggcgattcgt gcctcagctg caaccgaaac catagagaaa 240 

actgagactg cggggatcc 259 

<210> 40 
<211> 63 
<212> PRT 

<213> Arabidopsis thaliana 
<220> 

<221> TRANSIT 
<222> (1) . . (63) 
<223> plastidic 

plastidic 

(IPP-2) 

<400> 40 
Met Ser Ala Ser 
1 

Leu Ala Leu Ser 
20 

Leu Ser Ser lie 
35 

Gly Thr Ala Met 
50 

<210> 41 
<211> 205 
<212> DNA 

<213> Arabidopsis thaliana 



translocalisation signal derived from 
isopentenylpyrophosphate isomerase-2 



Ser Leu Phe Asn Leu Pro Leu lie Arg Leu Arg Ser 
5 10 15 

Ser Ser Phe Ser Ser Phe Arg Phe Ala His Arg Pro 
25 30 

Ser Pro Arg Lys Leu Pro Asn Phe Arg Ala Phe Ser 
40 45 

Thr Asp Thr Lys Asp Gly Ser Arg Val Asp Met 
55 60 
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<220> 

<221> transit_peptide 
<222> (1) . . (205) 

<223> plastidic translocalisation signal derived from 
plastidic isopentenylpyrophosphate isomerase-2 
(IPP-2) (frame 1) 

<400> 41 

gatatccaca ccaacaccaa tgtctgcttc ttctttattt aatctcccat tgattcgcct 60 
cagatctctc gctctttcgt cttctttttc ttctttccga tttgcccatc gtcctctgtc 120 
atcgatttca ccgagaaagt taccgaattt tcgtgctttc tctggtaccg ctatgacaga 180 
tactaaagat ggatcccggg tcgac 205 

<210> 42 
<211> 207 
<212> DNA 

<213> Arabidopsis thaliana 
<220> 

<221> transit_peptide 
<222> (1) . . (207) 

<223> plastidic translocalisation signal derived from 
plastidic isopentenylpyrophosphate isomerase-2 
(IPP-2) (frame 2) 

<400> 42 

gatatccaca ccaacaccaa tgtctgcttc ttctttattt aatctcccat tgattcgcct 60 

cagatctctc gctctttcgt cttctttttc ttctttccga tttgcccatc gtcctctgtc 120 

atcgatttca ccgagaaagt taccgaattt tcgtgctttc tctggtaccg ctatgacaga 180 
tactaaagat ctggatcccg ggtcgac 207 

<210> 43 
<211> 206 
<212> DNA 

<213> Arabidopsis thaliana 
<220> 

<221> transit_peptide 
<222> (1) . . (206) 

<223> plastidic translocalisation signal derived from 
plastidic isopentenylpyrophosphate isomerase-2 
(IPP-2 ) (frame 3) 

<400> 43 

gatatccaca ccaacaccaa tgtctgcttc ttctttattt aatctcccat tgattcgcct 60 

cagatctctc gctctttcgt cttctttttc ttctttccga tttgcccatc gtcctctgtc 120 

atcgatttca ccgagaaagt taccgaattt tcgtgctttc tctggtaccg ctatgacaga 180 

tactaaagat gggatcccgg gtcgac 206 

<210> 44 
<211> 44 
<212> DNA 

<213> Nicotiana tabacum 
<220> 

<221> promoter 
<222> (1)..(44) 

<223> plastidic promoter PrbcL 
<400> 44 

gttgcgctat atatatgaaa gagtatacaa taatgatgta tttg 44 

<210> 45 
<213> 64 
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<212> DNA 

<213> Nicotiana tabacum 
<220> 

<221> promoter 
<222> (1) . . (64) 

<223> plastidic promoter Prpsl6-107 
<400> 45 

tagcgatggg gtcttactaa agaaaaatat ttatccacct atctctatag tatatagata 60 
taga 64 

<210> 46 
<211> 91 
<212> DNA 

<213> Nicotiana tabacum 
<220> 

<221> promoter 
<222> (1)..(91) 

<223> plastidic promoter Prrnl6 
<400> 46 

cgccgtcgtt caatgagaat ggataagagg ctcgtgggat tgacgtgagg gggcagggat 60 
ggctatattt ctgggagcga actccgggcg a 91 

<210> 47 
<211> 71 
<212> DNA 

<213> Nicotiana tabacum 
<220> 

<221> promoter 
<222> (1) . . (71) 

<223> plastidic promoter PaccD-129 
<400> 47 

gtcgacatat tattttaaat aatataaagg gggttccaac atattaatat atagtgaagt 60 
gttccggatc c 71 

<210> 48 
<211> 27 
<212> DNA 

<213> Nicotiana tabacum 
<220> 

<221> promoter 
<222> (1)..(27) 

<223> plastidic promoter PclpP-53 
<400> 48 

agacaataaa aaaaattgtt acgtttc 27 

<210> 49 
<211> 65 
<212> DNA 

<213> Nicotiana tabacum 
<220> 

<221> promoter 
<222> (1) (65) 

<223> plastidic promoter Prrn-62 
<400> 49 

gagcgaactc cgggcgaata tgaagcgcat ggatacaagt tatgccttgg aatgaaagac 60 
aattc 65 
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<210> 50 
<211> 107 
<212> DNA 

<213> Nicotiana tabacum 
<220> 

<221> promoter 

<222> (1)..(107) 

<223> plastidic promoter Prpsl6 

<400> 50 

tctatatata tttatatatt aaatattaat taatatgtta gataaattaa tattagcgat 60 
ggggtcttac taaagaaaaa tatttatcca cctatctcta tagtata 107 

<210> 51 
<211> 47 
<212> DNA 

<213> Nicotiana tabacum 
<220> 

<221> promoter 
<222> (1)..(47) 

<223> plastidic promoter PatpB/E-290 
<400> 51 

agaaatagaa aataaagttc aggttcgaat tccatagaat agataat 47 

<210> 52 
<211> 25 
<212> DNA 

<213> Nicotiana tabacum 
<220> 

<221> promoter 
<222> (1) . . (25) 

<223> plastidic promoter PrpoB-345 
<400> 52 

aatgtgtatt atcataataa tggta 25 

<210> 53 
<211> 35 
<212> DNA 

<213> Kiinstliche Sequen2 
<220> 

<223> Beschreibung der kunstlichen Sequenz: consensus 
sequence of E.coli sigma70 promoter 

<400> 53 

ttgacattca ctcttcaatt atctataatg ataca 35 

<210> 54 
<211> 80 
<212> DNA 

<213> Nicotiana tabacum 
<220> 

<221> misc_feature 
<222> (1) . . (80) 

<223> 5 ' -untranslated region of psbA gene (incl. Ncol 
site) 

<400> 54 

tccattttct attttgattt gtagaaaact agtgtgcttg ggagtccctg atgattaaat 60 
aaaccaagat tttaccatgg 80 



WO 03/054189 PCT/EP02/14302 

20 

<210> 55 
<211> 40 
<212> DNA 

<213> Nicotiana tabacum 
<220> 

<221> misc_feature 
<222> (1) . . (40) 

<223> 5 '-untranslated region of rbcL gene 
<400> 55 

agttgtaggg agggattcat gacaccacaa acagccatgg 40 

<210> 56 
<211> 22 
<212> DNA 

<213> Nicotiana tabacum 
<220> 

<221> misc_feature 
<222> (1) . . (22) 

<223> 5 ' -untranslated region of rbcLs gene (modified) 
<400> 56 

agttgtaggg agggattcat ga 22 

<210> 57 
<211> 127 
<212> DNA 

<213> Synechocystis sp. 
<220> 

<221> misc_feature 
<222> (1) . . (127) 

<223> 3 ' -untranslated region of synechcystis psbA-1 gene 
<400> 57 

tgccattgcc ataactgctt tcggttagac ttcgtttcat ttggttaatc aagggcactc 60 
tcgcaatggg gtgcctttta tggtccaagg ttaaagttaa gccagtacta tttctagggt 120 
gaaatgt !27 

<210> 58 
<211> 90 
<212> DNA 

<213> Nicotiana tabacum 
<220> 

<221> misc_feature 
<222> (1) (90) 

<223> 3 ' -untranslated region of tobacco psbA gene 
<400> 58 

cctggcctag tctataggag gttttgaaaa gaaaggagca ataatcattt tcttgttcta 60 
tcaagagggt gctattgctc ctttcttttt 90 

<210> 59 
<211> 136 
<212> DNA 

<213> Nicotiana tabacum 
<220> 

<221> misc_feature 
<222> (1) . . (136) 

<223> 3 '-untranslated region of tobacco rbcL gene 
<400> 59 

agtagacatt agcagataaa ttagcaggaa ataaagaagg ataaggagaa agaactcaag 60 
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taattatcct tcgttctctt aattgaattg caattaaact cggcccaatc ttttactaaa 120 
aggattgagc cgaata 136 

<210> 60 
<211> 13 
<212> DNA 

<213> Ktinstliche Sequenz 
<220> 

<223> Beschreibung der kunstlichen Sequenz: synthetic 
ribosome binding site (RBS) 

<400> 60 

ggaggnnnnn atg 13 

<210> 61 
<211> 13 
<212> DNA 

<213> Kunstliche Sequenz 
<220> 

<223> Beschreibung der kunstlichen Sequenz: synthetic 
ribosome binding site (RBS) 

<400> 61 

ggaggatctc atg 13 

<210> 62 
<211> 1494 
<212> DNA 

<213> Kunstliche Sequenz 
<220> 

<223> Beschreibung der kunstlichen Sequenz: complete 
insert of vector pCB304-25 

<400> 62 

ggtaccgggc cgataattcc tggcctagtc tataggaggt tttgaaaaga aaggagcaat 60 
aatcattttc ttgttctatc aagagggtgc tattgctcct ttcttttttt ctcgagtacg 120 
ctagggataa cagggtaata tagaagcttg actctcttaa agatctcgac tctatatata 180 
tttatatatt aaatattaat taatatgtta gataaattaa tattagcgat ggggtcttac 240 
taaagaaaaa tatttatcca cctatctcta tagtatatag gatctagttg tagggaggga 300 
ttcatgacac cacaaacagc catgggagct tggattgaac aagatggatt gcacgcaggt 360 
tctccggccg cttgggtgga gaggctattc ggctatgact gggcacaaca gacaatcggc 420 
tgctctgatg ccgccgtgtt ccggctgtca gcgcaggggc gcccggttct ttttgtcaag 480 
accgacctgt ccggtgccct gaatgaactg caggacgagg cagcgcggct atcgtggctg 540 
gccacgacgg gcgttccttg cgcagctgtg ctcgacgttg tcactgaagc gggaagggac 600 
tggctgctat tgggcgaagt gccggggcag gatctcctgt catctcacct tgctcctgcc 660 
gagaaagtat ccatcatggc tgatgcaatg cggcggctgc atacgcttga tccggctacc 720 
tgcccattcg accaccaagc gaaacatcgc atcgagcgag cacgtactcg gatggaagcc 780 
ggtcttgtcg atcaggatga tctggacgaa gagcatcagg ggctcgcgcc agccgaactg 840 
ttcgccaggc tcaaggcgcg catgcccgac ggcgaggatc tcgtcgtgac ccatggcgat 900 
gcctgcttgc cgaatatcat ggtggaaaat ggccgctttt ctggattcat cgactgtggc 960 
cggctgggtg tggcggaccg ctatcaggac atagcgttgg ctacccgtga tattgctgaa 1020 
gagcttggcg gcgaatgggc tgaccgcttc ctcgtgcttt acggtatcgc cgctcccgat 1080 
tcgcagcgca tcgccttcta tcgccttctt gacgagttct tctgagcggg acccaagcta 1140 
ggcggccgcg gatccaagct tgaattcagt agacattagc agataaatta gcaggaaata 1200 
aagaaggata aggagaaaga actcaagtaa ttatccttcg ttctcttaat tgaattgcaa 1260 
ttaaactcgg cccaatcttt tactaaaagg attgagccga atactcgact taaggtagcg 1320 
tcgagtacgc gcccggggag cccaagggca cgccctggca cccgaagctc tagtatcaaa 1380 
tttggcacaa aaagcaaaat taaaatactg ataattgcca acacaattaa catctcaatc 1440 
aaggtaaatg ctttttgctt tttttgccaa agctatcttc cgtgatcaga gctc 1494 
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<210> 63 
<211> 592 
<212> DNA 

<213> Kiinstliche Sequenz 
<220> 

<223> Beschreibung der kiinstlichen Sequenz: Bglll / Muni 
fragment from vector pCB320-192 

<400> 63 

agatcttcca ttttctattt tgatttgtag aaaactagtg tgcttgggag tccctgatga 60 

ttaaataaac caagatttta ccatggcgct caccaatgct caaatcttgg ctgtgattga 120 

cagttgggaa gaaacagtcg gtcagtttcc agtgataacg caccatgtac cattaggtgg 180 

cggtctgcaa ggaacgctcc attgttacga gatcccccta gcagctcctt atggggttgg 240 

ctttgctaag aatgggccta cccgctggca atacaaacgg acaatcaatc aagtcgtcca 300 

cagatggggg tcccacacag tcccttttct attagaaccg gataacatca acggcaaaac 360 

ctgcacagca tcgcacctat gtcataatac tcgatgccac aatcccttgc acttgtgctg 420 

ggagtcacta gacgacaaca aaggcagaaa ctggtgcccc ggtcccaacg ggggatgtgt 480 

ccatgcggtg gtttgtttaa ggcagggtcc gttgtacggc ccaggggcga ctgtggcagg 540 

tcctcaacaa aggggcagtc actttgtggt ataactgcag aagcttcaat tg 592 

<210> 64 
<211> 25 
<212> DNA 

<213> Kiinstliche Sequenz 
<220> 

<223> Beschreibung der kiinstlichen Sequenz: 
oligonucleotide primer 

<400> 64 

aaagatctcc tcacaaaggg ggtcg 25 

<210> 65 
<211> 23 
<212> DNA 

<213> Kiinstliche Sequenz 
<220> 

<223> Beschreibung der kiinstlichen Sequenz: 
oligonucleotide primer 

<400> 65 

tcgaagactt aggaccgtta tag 23 

<210> 66 
<211> 26 
<212> DNA 

<213> KOnstliche Sequenz 
<220> 

<223> Beschreibung der kiinstlichen Sequenz: 
oligonucleotide primer 

<400> 66 

aggaagacct tgtcgggtaa gttccg 26 

<210> 67 
<211> 31 
<212> DNA 

<213> Kiinstliche Sequenz 
<220> 

<223> Beschreibung der kiinstlichen Sequenz: 
oligonucleotide primer 



\ 



WO 03/054189 PCT/EP02/14302 

23 

<400> 67 

ctcaattggg gtctctctgt ccaggtgcag g 31 

<210> 68 
<211> 672 
<212> DNA 

<213> Kunstliche Sequenz 
<220> 

<223> Beschreibung der ktinstlichen Sequenz: artificial 
fusion protein of I-Ppo I homing endonuclease and 
plastidic transit peptide 

<220> 

<221> CDS 

<222> (1) . . (669) 

<400> 68 

atg tct get tct tct tta ttt aat etc cca ttg att cgc etc aga tct 48 

Met Ser Ala Ser Ser Leu Phe Asn Leu Pro Leu He Arg Leu Arg Ser 
15 10 15 

etc get ctt teg tct tct ttt tct tct ttc cga ttt gec cat cgt cct 96 
Leu Ala Leu Ser Ser Ser Phe Ser Ser Phe Arg Phe Ala His Arg Pro 
20 25 30 

ctg tea teg att tea ccg aga aag tta ccg aat ttt cgt get ttc tct 144 
Leu Ser Ser He Ser Pro Arg Lys Leu Pro Asn Phe Arg Ala Phe Ser 
35 40 45 

ggt ace get atg aca gat act aaa gat ggg ate ccc atg gcg etc ace 192 
Gly Thr Ala Met Thr Asp Thr Lys Asp Gly He Pro Met Ala Leu Thr 
50 55 60 

aat get caa ate ttg get gtg att gac agt tgg gaa gaa aca gtc ggt 240 
Asn Ala Gin He Leu Ala Val He Asp Ser Trp Glu Glu Thr Val Gly 
65 70 75 80 

cag ttt cca gtg ata acg cac cat gta cca tta ggt ggc ggt ctg caa 288 
Gin Phe Pro Val He Thr His His Val Pro Leu Gly Gly Gly Leu Gin 
85 90 95 

gga acg etc cat tgt tac gag ate ccc eta gca get cct tat ggg gtt 336 
Gly Thr Leu His Cys Tyr Glu He Pro Leu Ala Ala Pro Tyr Gly Val 
100 105 110 

ggc ttt get aag aat ggg cct ace cgc tgg caa tac aaa egg aca ate 384 
Gly Phe Ala Lys Asn Gly Pro Thr Arg Trp Gin Tyr Lys Arg Thr He 
115 120 125 

aat caa gtc gtc cac aga tgg ggg tec cac aca gtc cct ttt eta tta 432 
Asn Gin Val Val His Arg Trp Gly Ser His Thr Val Pro Phe Leu Leu 
130 135 140 

gaa ccg gat aac ate aac ggc aaa ace tgc aca gca teg cac eta tgt 480 
Glu Pro Asp Asn He Asn Gly Lys Thr Cys Thr Ala Ser His Leu Cys 
145 150 155 160 

cat aat act cga tgc cac aat ccc ttg cac ttg tgc tgg gag tea eta 528 
His Asn Thr Arg Cys His Asn Pro Leu His Leu Cys Trp Glu Ser Leu 
165 170 175 

gac gac aac aaa ggc aga aac tgg tgc ccc ggt ccc aac ggg gga tgt 576 
Asp Asp Asn Lys Gly Arg Asn Trp Cys Pro Gly Pro Asn Gly Gly Cys 
180 185 190 

gtc cat gcg gtg gtt tgt tta agg cag ggt ccg ttg tac ggc cca ggg 624 
Val His Ala Val Val Cys Leu Arg Gin Gly Pro Leu Tyr Gly Pro Gly 
195 200 205 
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gcg act gtg gca ggt cct caa caa agg ggc agt cac ttt gtg gta taa 672 
Ala Thr Val Ala Gly Pro Gin Gin Arg Gly Ser His Phe Val Val 
210 215 220 

<210> 69 
<2U> 223 
<212> PRT 

<213> Kunstliche Sequenz 

<223> Beschreibung der kiinstlichen Sequenz: artificial 
fusion protein of I-Ppo I homing endonuclease and 
plastidic transit peptide 

<400> 69 

Met Ser Ala Ser Ser Leu Phe Asn Leu Pro Leu lie Arg Leu Arg Ser 
15 10 15 

Leu Ala Leu Ser Ser Ser Phe Ser Ser Phe Arg Phe Ala His Arg Pro 
20 25 30 

Leu Ser Ser He Ser Pro Arg Lys Leu Pro Asn Phe Arg Ala Phe Ser 
35 40 45 

Gly Thr Ala Met Thr Asp Thr Lys Asp Gly He Pro Met Ala Leu Thr 
50 55 60 

Asn Ala Gin He Leu Ala Val He Asp Ser Trp Glu Glu Thr Val Gly 
65 70 75 80 

Gin Phe Pro Val He Thr His His Val Pro Leu Gly Gly Gly Leu Gin 
85 90 95 

Gly Thr Leu His Cys Tyr Glu He Pro Leu Ala Ala Pro Tyr Gly Val 
100 105 110 

Gly Phe Ala Lys Asn Gly Pro Thr Arg Trp Gin Tyr Lys Arg Thr He 
115 120 125 

Asn Gin Val Val His Arg Trp Gly Ser His Thr Val Pro Phe Leu Leu 
130 135 140 

Glu Pro Asp Asn He Asn Gly Lys Thr Cys Thr Ala Ser His Leu Cys 
145 150 155 160 

His Asn Thr Arg Cys His Asn Pro Leu His Leu Cys Trp Glu Ser Leu 
165 170 175 

Asp Asp Asn Lys Gly Arg Asn Trp Cys Pro Gly Pro Asn Gly Gly Cys 
180 185 190 

Val His Ala Val Val Cys Leu Arg Gin Gly Pro Leu Tyr Gly Pro Gly 
195 200 205 

Ala Thr Val Ala Gly Pro Gin Gin Arg Gly Ser His Phe Val Val 
210 215 220. 



<210> 70 
<211> 558 
<212> DNA 

<213> Physarum polycephalum 

<220> 

<221> CDS 

<222> (1)..(555) 

<223> coding for long version of I-Ppol 
<400> 70 

atg gcg aaa tec aac caa get egg gta aac ggc ggg agt aac tat gac 48 



WO 03/054189 



25 



PCT/EP02/14302 



Met Ala Lys ser Asn Gin Ala Arg Val Asn Gly Gly Ser Asn Tyr Asp 
15 10 15 

tct etc acc ccc tta aat atg gcg etc acc aat get caa ate ttg get 96 
Ser Leu Thr Pro Leu Asn Met Ala Leu Thr Asn Ala Gin He Leu Ala 
20 25 30 

gtg att gac age tgg gaa gaa aca gtc ggt cag ttt cca gtg ata acg 144 
Val He Asp Ser Trp Glu Glu Thr Val Gly Gin Phe Pro Val He Thr 
35 40 45 

cac cat gta cca tta ggt ggc ggt ctg caa gga acg etc cat tgt tac 192 
His His Val Pro Leu Gly Gly Gly Leu Gin Gly Thr Leu His Cys Tyr 
50 55 60 

gag ate ccc eta gca get cct tat ggg gtt ggc ttt get aag aat ggg 240 
Glu He Pro Leu Ala Ala Pro Tyr Gly Val Gly Phe Ala Lys Asn Gly 
65 70 75 80 

cct acc cgc tgg caa tac aaa egg aca ate aat caa gtc gtc cac aga 288 
Pro Thr Arg Trp Gin Tyr Lys Arg Thr He Asn Gin Val Val His Arg 
85 90 95 

tgg gga tec cac aca gtc cct ttt eta tta gaa ccg gat aac ate aac 336 
Trp Gly Ser His Thr Val Pro Phe Leu Leu Glu Pro Asp Asn He Asn 
100 105 110 

ggc aaa acc tgc aca gca teg cac eta tgt cat aat act cga tgc cac 384 
Gly Lys Thr Cys Thr Ala Ser His Leu Cys His Asn Thr Arg Cys His 
115 120 125 

aat ccc ttg cac ttg tgc tgg gag tea eta gac gac aac aaa ggc aga 432 
Asn Pro Leu His Leu Cys Trp Glu Ser Leu Asp Asp Asn Lys Gly Arg 
130 135 140 

aac tgg tgc ccg ggt ccc aac ggg gga tgt gtc cat gcg gtg gtt tgt 480 
Asn Trp Cys Pro Gly Pro Asn Gly Gly Cys Val His Ala Val Val Cys 
145 150 155 160 

tta agg cag ggt ccg ttg tac ggc ccg ggg gcg act gtg gca ggt cct 528 
Leu Arg Gin Gly Pro Leu Tyr Gly Pro Gly Ala Thr Val Ala Gly Pro 
165 170 175 

caa caa agg ggc agt cac ttt gtg gta taa 558 
Gin Gin Arg Gly Ser His Phe Val Val 
180 185 

<210> 71 
<211> 185 
<212> PRT 

<213> Physarum polycephalum 
<400> 71 

Met Ala Lys Ser Asn Gin Ala Arg Val Asn Gly Gly Ser Asn Tyr Asp 
1^5 10 15 

Ser Leu Thr Pro Leu Asn Met Ala Leu Thr Asn Ala Gin He Leu Ala 
20 25 30 

Val He Asp Ser Trp Glu Glu Thr Val Gly Gin Phe Pro Val He Thr 
35 40 45 

His His Val Pro Leu Gly Gly Gly Leu Gin Gly Thr Leu His Cys Tyr 
50 55 60 

Glu He Pro Leu Ala Ala Pro Tyr Gly Val Gly Phe Ala Lys Asn Gly 
65 70 75 80 



WO 03/054189 PCT/EP02/14302 

26 

Pro Thr Arg Trp Gin Tyr Lys Arg Thr He Asn Gin Val Val His Arg 
85 90 95 

Trp Gly Ser His Thr Val Pro Phe Leu Leu Glu Pro Asp Asn He Asn 
100 105 110 

Gly Lys Thr Cys Thr Ala Ser His Leu Cys His Asn Thr Arg Cys His 
115 120 125 

Asn Pro Leu His Leu Cys Trp Glu Ser Leu Asp Asp Asn Lys Gly Arg 
130 135 140 

Asn Trp Cys Pro Gly Pro Asn Gly Gly Cys Val His Ala Val Val Cys 
145 150 155 160 

Leu Arg Gin Gly Pro Leu Tyr Gly Pro Gly Ala Thr Val Ala Gly Pro 
165 170 175 

Gin Gin Arg Gly Ser His Phe Val Val 
180 185 



<210> 72 
<211> 34 
<212> DNA 

<213> Escherichia coli 
<220> 

<221> promoter 
<222> <1)..<34) 

<223> coding for promoter derived from consensus of 
sigma70 E.coli promoters 

<400> 72 

ttgacaattt tcctctgaat tatataatta acat 34 

<210> 73 
<211> 413 
<212> DNA 

<213> Kunstliche Sequenz 
<220> 

<223> Beschreibung der kunstlichen Sequenz: artificial 
intron Tet3TVS2a 

<400> 73 

aaatagcaat atttttcgtt gccttaaaaa gttatcaggc atgcacctgg tagctagtct 60 

ttaaaccaat agattgcatc ggtttaaaag gcaagaccgt caaattgcgg gaaaggggtc 120 

aacagccgtt cagtaccaag tctcagggga aactttgaga tggccttgca aagggtatgg 180 

taataagctg acggacatgg tcctaaccac gcagccaagt cctaagtcaa cagatcttct 240 

gttgatatgg atgcagttca cagactaaat gtcggtcggg gaagatgtat tcttctcata 300 

agatatagtc ggacctctcc ttaatgggag ctagcggatg aagtgatgca acactggagc 360 

cgctgggaac taatttgtat gcgaaagtat attgattagt tttggagtac teg 413 

<210> 74 

<211> 791 

<212> DNA 

<213> Kunstliche Sequenz 
<220> 

<223> Beschreibung der kunstlichen Sequenz: insert of 
plasmid pCB459-l 

<400> 74 

ttacaatttc cattcgccat teaggctgeg caactgttgg gaagggegat eggtgeggge 60 
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ctcttcgcta ttacgccagc tggcgaaagg gggatgtgct gcaaggcgat taagttgggt 120 

aacgccaggg ttttcccagt cacgacgttg taaaacgacg gccagtgagc gcgcgtaata 180 

cgactcacta tagggcgaat tgggtaccgg gccccccctc gaggtcgacg gtatcgataa 240 

gcttgacccg acaaggaatt tcgctcgagt actccaaaac taatcaatat actttcgcat 300 

acaaattagt tcccagcggc tccagtgttg catcacttca tccgctagct cccattaagg 360 

agaggtccga ctatatctta tgagaagaat acatcttccc cgaccgacat ttagtctgtg 420 

aactgcatcc atatcaacag aagatctgtt gacttaggac ttggctgcgt ggttaggacc 480 

atgtccgtca gcttattacc ataccctttg caaggccatc tcaaagtttc ccctgagact 540 

tggtactgaa cggctgttga cccctttccc gcaatttgac ggtcttgcct tttaaaccga 600 

tgcaatctat tggtttaaag actagctacc aggtgcatgc ctgataactt tttaaggcaa 660 

cgaaaaatat tgctatttac cttaggaccg ttaggatcca ctagttctag agcggccgcc 720 

accgcggtgg agctccagct tttgttccct ttagtgaggg ttaattgcgc gcttggcgta 780 
atcatggtca t 791 

<210> 75 
<211> 1291 
<212> DNA 

<213> Ktinstliche Sequenz 
<220> 

<223> Beschreibung der kOnstlichen Sequenz: insert of 
vector pCB478-3 

<400> 75 

ttacaatttc cattcgccat tcaggctgcg caactgttgg gaagggcgat cggtgcgggc 60 
ctcttcgcta ttacgccagc tggcgaaagg gggatgtgct gcaaggcgat taagttgggt 120 
aacgccaggg ttttcccagt cacgacgttg taaaacgacg gccagtgagc gcgcgtaata 180 
cgactcacta tagggcgaat tgggtaccgg gccccccctc gaggtcgacg gtatcgataa 240 
gcttgacccg acaaggaatt tcgctcgagt actccaaaac taatcaatat actttcgcat 300 
acaaattagt tcccagcggc tccagtgttg catcacttca tccgctagct cccattaagg 360 
agaggtccga ctatatctta tgagaagaat tttgatcctt actcgccagt ttcttcaaaa 420 
cgtttgatag gttcctggta gtttttctca ttgatacgga gtttttttgc taaatccaac 480 
actttctcga atccttcctg cgattctaaa tgtctacctg cttttaacag caagcagatt 540 
tttcgaaatc gaagaaattc aattcttctt tttgttttta gctcatgttt ttcgaaaaat 600 
ggtataatga cggttataaa gtgatcaata tttttgactt tatagcaaag ccgttcccca 660 
tgattcacaa cgactgatcc aactttaaag tagtctttta atgcatataa aacatttgca 720 
tctaatttat gttgggtcac tacgaattaa ttctggttga agctgatggc catagcgcaa 780 
cgaattattt ctaagtatac ttacactaaa acaaccttcc ccatctacga aacctgtaat 840 
ccattgagga ttaatgtcca tggtccctcc ctacaacgtc tgcagatcaa acatcttccc 900 
cgaccgacat ttagtctgtg aactgcatcc atatcaacag aagatctgtt gacttaggac 960 
ttggctgcgt ggttaggacc atgtccgtca gcttattacc ataccctttg caaggccatc 1020 
tcaaagtttc ccctgagact tggtactgaa cggctgttga cccctttccc gcaatttgac 1080 
ggtcttgcct tttaaaccga tgcaatctat tggtttaaag actagctacc aggtgcatgc 1140 
ctgataactt tttaaggcaa cgaaaaatat tgctatttac cttaggaccg ttaggatcca 1200 
ctagttctag agcggccgcc accgcggtgg agctccagct tttgttccct ttagtgaggg 1260 
ttaattgcgc gcttggcgta atcatggtca t 1291 

<210> 76 
<211> 1386 
<212> DNA 

<213> Kttnstliche Sequenz 
<220> 

<223> Beschreibung der kiinstlichen Sequenz: insert of 
vector pCB492-25 

<400> 76 

gcgcgcgtaa tacgactcac tatagggcga attgggggcg actgtttacc aaaaacacag 60 
gtctccgcaa agtcgtaaga ccatgtatgg gggctgacgc ctgcccagtg ccggaaggtc 120 
aaggaagttg gtgacctgat gacaggggag ccggcgaccg aagccccggt gaacggcggc 180 
cgtaactata acggtcctaa ggtaaatagc aatatttttc gttgccttaa aaagttatca 240 
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ggcatgcacc tggtagctag tctttaaacc aatagattgc atcggtttaa aaggcaagac 300 
cgtcaaattg cgggaaaggg gtcaacagcc gttcagtacc aagtctcagg ggaaactttg 360 
agatggcctt gcaaagggta tggtaataag ctgacggaca tggtcctaac cacgcagcca 420 
agtcctaagt caacagatct tctgttgata tggatgcagt tcacagacta aatgtcggtc 480 
ggggaagatg tttgatctgc agacgttgta gggagggacc atggacatta atcctcaatg 540 
gattacaggt ttcgtagatg gggaaggttg ttttagtgta agtatactta gaaataattc 600 
gttgcgctat ggccatcagc ttcaaccaga attcgtagtg acccaacata aattagatgc 660 
aaatgtttta tatgcattaa aagactactt taaagttgga tcagtcgttg tgaatcatgg 720 
ggaacggctt tgctataaag tcaaaaatat tgatcacttt ataaccgtca ttataccatt 780 
tttcgaaaaa catgagctaa aaacaaaaag aagaattgaa tttcttcgat ttcgaaaaat 840 
ctgcttgctg ttaaaagcag gtagacattt agaatcgcag gaaggattcg agaaagtgtt 900 
ggatttagca aaaaaactcc gtatcaatga gaaaaactac caggaatcta tcaaacgttt 960 
tgaagaaact ggcgagtaag gatcaaaatt cttctcataa gatatagtcg gacctctcct 1020 
taatgggagc tagcggatga agtgatgcaa cactggagcc gctgggaact aatttgtatg 1080 
cgaaagtata ttgattagtt ttggagtact cgagcgaaat tccttgtcgg gtaagttccg 1140 
acccgcacga aaggcgtaac gatctgggca ctgtctcgga gagaggctcg gtgaaataga 1200 
catgtctgtg aagatgcgga ctacctgcac ctggacagag agaccccaat tcctggccta 1260 
gtctatagga ggttttgaaa agaaaggagc aataatcatt ttcttgttct atcaagaggg 1320 
tgctattgct cctttctttt tttctcgacc agcttttgtt ccctttagtg agggttaatt 1380 
gcgcgc 1386 

<210> 77 
<211> 60 
<212> DNA 

<213> Kiinstliche Sequenz 
<220> 

<223> Beschreibung der kunstlichen Sequenz: 
oligonucleotide primer 

<400> 77 

tagtaaatga caattttcct ctgaattata taattaacat ggcgactgtt taccaaaaac 60 

<210> 78 
<211> 31 
<212> DNA 

<213> Kiinstliche Sequenz 
<220> 

<223> Beschreibung der kOnstlichen Sequenz: 
oligonucleotide primer 



<400> 78 

ctcaattggg gtctctctgt ccaggtgcag g 

<210> 79 
<211> 1258 
<212> DNA 

<213> Kiinstliche Sequenz 



31 



<220> 

<223> Beschreibung der ktinstlichen Sequenz: PCR product 
Pr om-Te 1 1 VS2 a-Cpa 

<400> 79 

tagtaaatga caattttcct ctgaattata taattaacat ggcgactgtt taccaaaaac 60 
acaggtctcc gcaaagtcgt aagaccatgt atgggggctg acgcctgccc agtgccggaa 120 
ggtcaaggaa gttggtgacc tgatgacagg ggagccggcg accgaagccc cggtgaacgg 180 
cggccgtaac tataacggtc ctaaggtaaa tagcaatatt tttcgttgcc ttaaaaagtt 240 
atcaggcatg cacctggtag ctagtcttta aaccaataga ttgcatcggt ttaaaaggca 300 
agaccgtcaa attgcgggaa aggggtcaac agccgttcag taccaagtct caggggaaac 360 
tttgagatgg ccttgcaaag ggtatggtaa taagctgacg gacatggtcc taaccacgca 420 
gccaagtcct aagtcaacag atcttctgtt gatatggatg cagttcacag actaaatgtc 480 



WO 03/054189 



29 



PCT/EP02/14302 



ggtcggggaa gatgtttgat ctgcagacgt tgtagggagg gaccatggac attaatcctc 540 
aatggattac aggtttcgta gatggggaag gttgttttag tgtaagtata cttagaaata 600 
attcgttgcg ctatggccat cagcttcaac cagaattcgt agtgacccaa cataaattag 660 
atgcaaatgt tttatatgca ttaaaagact actttaaagt tggatcagtc gttgtgaatc 720 
atggggaacg gctttgctat aaagtcaaaa atattgatca ctttataacc gtcattatac 780 
catttttcga aaaacatgag ctaaaaacaa aaagaagaat tgaatttctt cgatttcgaa 840 
aaatctgctt gctgttaaaa gcaggtagac atttagaatc gcaggaagga ttcgagaaag 900 
tgttggattt agcaaaaaaa ctccgtatca atgagaaaaa ctaccaggaa tctatcaaac 960 
gttttgaaga aactggcgag taaggatcaa aattcttctc ataagatata gtcggacctc 1020 
tccttaatgg gagctagcgg atgaagtgat gcaacactgg agccgctggg aactaatttg 1080 
tatgcgaaag tatattgatt agttttggag tactcgagcg aaattccttg tcgggtaagt 1140 
tccgacccgc acgaaaggcg taacgatctg ggcactgtct cggagagagg ctcggtgaaa 1200 
tagacatgtc tgtgaagatg cggactacct gcacctggac agagagaccc caattgag 1258 

<210> 80 
<211> 4746 
<212> DNA 

<213> Kunstliche Sequenz 
<220> 

<223> Beschreibung der kttnstlichen Sequenz: insert of 
vector pCB435-45 

<400> 80 

gcgcccaata cgcaaaccgc ctctccccgc gcgttggccg attcattaat gcagtgatga 60 
cttgacggca tcctcacctt cctccggctt atcaccggca gtctgttcag ggttccaaac 120 
tcaacgatgg caactaaaca cgagggttgc gctcgttgcg ggacttaacc caacacctta 180 
cggcacgagc tgacgacagc catgcaccac ctgtgtccgc gttcccgaag gcacccctct 240 
ctttcaagag gattcgcggc atgtcaagcc ctggtaaggt tcttcgcttt gcatcgaatt 300 
aaaccacatg ctccaccgct tgtgcgggcc cccgtcaatt ccttttagtt tcattcttgc 360 
gaacgtactc cccaggcggg atacttaacg cgttagctac agcactgcac gggtcgatac 420 
gcacagcgcc tagtatccat cgtttacggc taggactact ggggtatcta atcccattcg 480 
ctcccctagc tttcgtctct cagtgtcagt gtcggcccag cagagtgctt tcgccgttgg 540 
tgttctttcc gatctctacg catttcaccg ctccaccgga aattccctct gcccctaccg 600 
tactccagct tggtagtttc caccgcctgt ccagggttga gccctgggat ttgacggcgg 660 
acttaaaaag ccacctacag acgctttacg cccaatcatt ccggataacg cttgcatcct 720 
ctgtattacc gcggctgctg gcacagagtt agccgatgct tattccccag ataccgtcat 780 
tgcttcttct ccgggaaaag aagttcacga cccgtgggcc ttctacctcc acgcggcatt 840 
gctccgtcag gctttcgccc attgcggaaa attccccact gctgcctccc gtaggagtct 900 
gggccgtgtc tcagtcccag tgtggctgat catcctctcg gaccagctac tgatcatcgc 960 
cttggtaagc tattgcctca ccaactagct aatcagacgc gagcccctcc tcgggcggat 1020 
tcctcctttt gctcctcagc ctacggggta ttagcagccg tttccagctg ttgttcccct 1080 
cccaagggca ggttcttacg cgttactcac ccgtccgcca ctggaaacac cacttcccgt 1140 
ccgacttgca tgtgttaagc atgccgccag cgttcatcct gagccaggat cgaactctcc 1200 
atgagattca tagttgcatt acttatagct tccttgttcg tagacaaagc ggattcggaa 1260 
ttgtctttca ttccaaggca taacttgtat ccatgcgctt catattcgcc cggagttcgc 1320 
tcccagaaat atagccatcc ctgccccctc acgtcaatcc cacgagcctc ttatccattc 1380 
tcattgaacg acggcggggg agcgcgggcc ccccctcgac atatatttta aataatataa 1440 
agggggttcc aacatattaa tatatagtga agtgttccgg atccactagg acgttgtagg 1500 
gagggaccat ggacattaat cctcaatgga ttacaggttt cgtagatggg gaaggttgtt 1560 
ttagtgtaag tatacttaga aataattcgt tgcgctatgg ccatcagctt caaccagaat 1620 
tcgtagtgac ccaacataaa ttagatgcaa atgttttata tgcattaaaa gactacttta 1680 
aagttggatc agtcgttgtg aatcatgggg aacggctttg ctataaagtc aaaaatattg 1740 
atcactttat aaccgtcatt ataccatttt tcgaaaaaca tgagctaaaa acaaaaagaa 1800 
gaattgaatt tcttcgattt cgaaaaatct gcttgctgtt aaaagcaggt agacatttag 1860 
aatcgcagga aggattcgag aaagtgttgg atttagcaaa aaaactccgt atcaatgaga 1920 
aaaactacca ggaatctatc aaacgttttg aagaaactgg cgagtaactc gagaaaaaaa 1980 
gaaaggagca atagcaccct cttgatagaa caagaaaatg attattgctc ctttcttttc 2040 
aaaacctcct atagactagg ccaggaatta tctgcagtta tttgccaact accttagtga 2100 
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tctcgccttt cacgtagtgg acaaattctt ccaactgatc tgcgcgcgag gccaagcgat 2160 
cttcttcttg tccaagataa gcctgtctag cttcaagtat gacgggctga tactgggccg 2220 
gcaggcgctc cattgcccag tcggcagcga catccttcgg cgcgattttg ccggttactg 2280 
cgctgtacca aatgcgggac aacgtaagca ctacatttcg ctcatcgcca gcccagtcgg 2340 
gcggcgagtt ccatagcgtt aaggtttcat ttagcgcctc aaatagatcc tgttcaggaa 2400 
ccggatcaaa gagttcctcc gccgctggac ctaccaaggc aacgctatgt tctcttgctt 2460 
ttgtcagcaa gatagccaga tcaatgtcga tcgtggctgg ctcgaagata cctgcaagaa 2520 
tgtcattgcg ctgccattct ccaaattgca gttcgcgctt agctggataa cgccacggaa 2580 
tgatgtcgtc gtgcacaaca atggtgactt ctacagcgcg gagaatctcg ctctctccag 2640 
gggaagccga agtttccaaa aggtcgttga tcaaagctcg ccgcgttgtt tcatcaagcc 2700 
ttacggtcac cgtaaccagc aaatcaatat cactgtgtgg cttcaggccg ccatccactg 2760 
cggagccgta caaatgtacg gccagcaacg tcggttcgag atggcgctcg atgacgccaa 2820 
ctacctctga tagttgagtt gatacttcgg cgataaccgc ttcacgagcc atgaatccct 2880 
ccctacaact agatcctcgc ccggagttcg ctcccagaaa tatagccatc cctgccccct 2940 
cacgtcaatc ccacgagcct cttatccatt ctcattgaac gacggcgtcg agggggggcc 3000 
cggtaccaaa tccaactaga aaaactcaca ttgggcttag ggataatcag gctcgaactg 3060 
atgacttcca ccacgtcaag gtgacactct accgctgagt tatatccctt ccccgcccca 3120 
tcgagaaata gaactgacta atcctaagtc aaagggtcga gaaactcaac gccactattc 3180 
ttgaacaact tggagccggg ccttcttttc gcactattac ggatatgaaa ataatggtca 3240 
aaatcggatt caattgtcaa ctgcccctat cggaaatagg attgactacc gattccgaag 3300 
gaactggagt tacatctctt ttccattcaa gagttcttat gcgtttccac gcccctttga 3360 
gaccccgaaa aatggacaaa ttccttttct taggaacaca tacaagattc gtcactacaa 3420 
aaaggataat ggtaacccta ccattaacta cttcatttat gaatttcata gtaatagaaa 3480 
tacatgtcct accgagacag aatttggaac ttgctatcct cttgcctagc aggcaaagat 3540 
ttacctccgt ggaaaggatg attcattcgg atcgacatga gagtccaact acattgccag 3600 
aatccatgtt gtatatttga aagaggttga cctccttgct tctctcatgg tacactcctc 3660 
ttcccgccga gccccttttc tcctcggtcc acagagacaa aatgtaggac tggtgccaac 3720 
aattcatcag actcactaag tcgggatcac taactaatac taatctaata taatagtcta 3780 
atatatctaa tataatagaa aatactaata taatagaaaa gaactgtctt ttctgtatac 3840 
tttccccggt tccgttgcta ccgagggcct cgtgatacgc ctatttttat aggttaatgt 3900 
catgaccaaa atcccttaac gtgagttttc gttccactga gcgtcagacc ccgtagaaaa 3960 
gatcaaagga tcttcttgag atcctttttt tctgcgcgta atctgctgct tgcaaacaaa 4020 
aaaaccaccg ctaccagcgg tggtttgttt gccggatcaa gagctaccaa ctctttttcc 4080 
gaaggtaact ggcttcagca gagcgcagat accaaatact gtccttctag tgtagccgta 4140 
gttaggccac cacttcaaga actctgtagc accgcctaca tacctcgctc tgctaatcct 4200 
gttaccagtg gctgctgcca gtggcgataa gtcgtgtctt accgggttgg actcaagacg 4260 
atagttaccg gataaggcgc agcggtcggg ctgaacgggg ggttcgtgca cacagcccag 4320 
cttggagcga acgacctaca ccgaactgag atacctacag cgtgagctat gagaaagcgc 4380 
cacgcttccc gaagggagaa aggcggacag gtatccggta agcggcaggg tcggaacagg 4440 
agagcgcacg agggagcttc cagggggaaa cgcctggtat ctttatagtc ctgtcgggtt 4500 
tcgccacctc tgacttgagc gtcgattttt gtgatgctcg tcaggggggc ggagcctatg 4560 
gaaaaacgcc agcaacgcgg cctttttacg gttcctggcc ttttgctggc cttttgctca 4620 
catgttcttt cctgcgttat cccctgattc tgtggataac cgtattaccg cctttgagtg 4680 
agctgatacc gctcgccgca gccgaacgac cgagcgcagc gagtcagtga gcgaggaagc 4740 
ggaaga 4746 

<210> 81 
<211> 1213 
<212> DNA 

<213> Kunstliche Seqaenz 
<220> 

<223> Beschreibung der kiinstlichen Sequenz: probe for 
Southern blot analysis (16SrDNA) 

<400> 81 

ttatcaccgg cagtctgttc agggttccaa actcaacgat ggcaactaaa cacgagggtt 60 
gcgctcgttg cgggacttaa cccaacacct tacggcacga gctgacgaca gccatgcacc 120 
acctgtgtcc gcgttcccga aggcacccct ctctttcaag aggattcgcg gcatgtcaag 180 
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ccctggtaag gttcttcgct ttgcatcgaa ttaaaccaca tgctccaccg cttgtgcggg 240 
cccccgtcaa ttccttttag tttcattctt gcgaacgtac tccccaggcg ggatacttaa 300 
cgcgttagct acagcactgc acgggtcgat acgcacagcg cctagtatcc atcgtttacg 360 
gctaggacta ctggggtatc taatcccatt cgctccccta gctttcgtct ctcagtgtca 420 
gtgtcggccc agcagagtgc tttcgccgtt ggtgttcttt ccgatctcta cgcatttcac 480 
cgctccaccg gaaattccct ctgcccctac cgtactccag cttggtagtt tccaccgcct 540 
gtccagggtt gagccctggg atttgacggc ggacttaaaa agccacctac agacgcttta 600 
cgcccaatca ttccggataa cgcttgcatc ctctgtatta ccgcggctgc tggcacagag 660 
ttagccgatg cttattcccc agataccgtc attgcttctt ctccgggaaa agaagttcac 720 
gacccgtggg ccttctacct ccacgcggca ttgctccgtc aggctttcgc ccattgcgga 780 
aaattcccca ctgctgcctc ccgtaggagt ctgggccgtg tctcagtccc agtgtggctg 840 
atcatcctct cggaccagct actgatcatc gccttggtaa gctattgcct caccaactag 900 
ctaatcagac gcgagcccct cctcgggcgg attcctcctt ttgctcctca gcctacgggg 960 
tattagcagc cgtttccagc tgttgttccc ctcccaaggg caggttctta cgcgttactc 1020 
acccgtccgc cactggaaac accacttccc gtccgacttg catgtgttaa gcatgccgcc 1080 
agcgttcatc ctgagccagg atcgaactct ccatgagatt catagttgca ttacttatag 1140 
cttccttgtt cgtagacaaa gcggattcgg aattgtcttt cattccaagg cataacttgt 1200 
atccatgcgc ttc 1213 

<210> 82 
<211> 949 
<212> DNA 

<213> KOnstliche Sequenz 
<220> 

<223> Beschreibung der kttnstlichen Sequenz: probe for 
Southern blot (23SrDNA) 

<400> 82 

catcgtcgag agggaaacag cccggatcac cagctaaggc ccctaaatga tcgctcagtg 60 
ataaaggagg taggggtgca gagacagcca ggaggtttgc ctagaagcag ccacccttga 120 
aagagtgcgt aatagctcac tgatcgagcg ctcttgcgcc gaagatgaac ggggctaagc 180 
gatctgccga agctgtggga tgtaaaaata catcggtagg ggagcgttcc gccttagaga 240 
gaagcctccg cgcgagcggt ggtggacgaa gcggaagcga gaatgtcggc ttgagtaacg 300 
caaacattgg tgagaatcca atgccccgaa aacctaaggg ttcctccgca aggttcgtcc 360 
acggagggtg agtcagggcc taagatcagg ccgaaaggcg tagtcgatgg acaacaggtg 420 
aatattcctg tactgcccct tgttggtccc gagggacgga ggaggctagg ttagccgaaa 480 
gatggttatc ggttcaagaa cgtaaggtgt ccctgctttg tcagggtaag aaggggtaga 540 
gaaaatgcct cgagccaatg ttcgaatacc aggcgctacg gcgctgaagt aacccatgcc 600 
atactcccag gaaaagctcg aacgactttg agcaagaggg tacctgtacc cgaaaccgac 660 
acaggtgggt aggtagagaa tacctagggg cgcgagacaa ctctctctaa ggaactcggc 720 
aaaatagccc cgtaacttcg ggagaagggg tgcctcctca caaagggggt cgcagtgacc 780 
aggcccgggc gactgtttac caaaaacaca ggtctccgca aagtcgtaag accatgtatg 840 
ggggctgacg cctgcccagt gccggaaggt caaggaagtt ggtgacctga tgacagggga 900 
gccggcgacc gaagccccgg tgaacggcgg ccgtaactat aacggtcct 949 

<210> 83 
<211> 1287 
<212> DNA 

<213> Kunstliche Sequenz 
<220> 

<223> Beschreibung der kOnstlichen Sequenz: insert of 
vector pCB456-2 

<400> 83 

gagctctcag tactcgagac atttcaccct agaaatagac ttaaacttta ctggcttaac 60 
tttaaccttg gaccataaaa ggcaccccat tgcgagagtg cccttgatta accaaatgaa 120 
acgaagtcta accgaaagca gttatggcaa tggcagaatt ctgatcacgg aagatagctt 180 
tggcaaaaaa agcaaaaagc atttaccttg attgagatgt taattgtgtt ggcaattatc 240 
agtattttaa ttttgctttt tgtgccaaat ttgatactag agcttcgggt gccagggcgt 300 
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gcccttgggc tccccgggcg cgtactcgac gctaccttaa gagagtcaag ctaattctaa 360 
tctgcagtct agcgtgcggc cgctctagaa ctagtggatc ccccgggctg cagttatttg 420 
ccaactacct tagtgatctc gcctttcacg tagtggacaa attcttccaa ctgatctgcg 480 
cgcgaggcca agcgatcttc ttcttgtcca agataagcct gtctagcttc aagtatgacg 540 
ggctgatact gggccggcag gcgctccatt gcccagtcgg cagcgacatc cttcggcgcg 600 
attttgccgg ttactgcgct gtaccaaatg cgggacaacg taagcactac atttcgctca 660 
tcgccagccc agtcgggcgg cgagttccat agcgttaagg tttcatttag cgcctcaaat 720 
agatcctgtt caggaaccgg atcaaagagt tcctccgccg ctggacctac caaggcaacg 780 
ctatgttctc ttgcttttgt cagcaagata gccagatcaa tgtcgatcgt ggctggctcg 840 
aagatacctg caagaatgtc attgcgctgc cattctccaa attgcagttc gcgcttagct 900 
ggataacgcc acggaatgat gtcgtcgtgc acaacaatgg tgacttctac agcgcggaga 960 
atctcgctct ctccagggga agccgaagtt tccaaaaggt cgttgatcaa agctcgccgc 1020 
gttgtttcat caagccttac ggtcaccgta accagcaaat caatatcact gtgtggcttc 1080 
aggccgccat ccactgcgga gccgtacaaa tgtacggcca gcaacgtcgg ttcgagatgg 1140 
cgctcgatga cgccaactac ctctgatagt tgagttgata cttcggcgat aaccgcttca 1200 
cgagccatga gatcctccag atccatgtat cattatagat aattgaagag tgaatgtcaa 1260 
gtcgacctcg agggggggcc cggtacc 1287 

<210> 84 
<211> 1387 
<212> DNA 

<213> Kunstliche Sequenz 
<220> 

<223> Be^chreibung der ktinstlichen Sequenz: insert of 
vector pCB528-2 

<400> 84 

ggtaccccag ttaactggag atctcgagga ggtcacatgg gagcttggat tgaacaagat 60 

ggattgcacg caggttctcc ggccgcttgg gtggagaggc tattcggcta tgactgggca 120 

caacagacaa tcggctgctc tgatgccgcc gtgttccggc tgtcagcgca ggggcgcccg 180 

gttctttttg tcaagaccga cctgtccggt gccctgaatg aactgcagga cgaggcagcg 240 

cggctatcgt ggctggccac gacgggcgtt ccttgcgcag ctgtgctcga cgttgtcact 300 

gaagcgggaa gggactggct gctattgggc gaagtgccgg ggcaggatct cctgtcatct 360 

caccttgctc ctgccgagaa agtatccatc atggctgatg caatgcggcg gctgcatacg 420 

cttgatccgg ctacctgccc attcgaccac caagcgaaac atcgcatcga gcgagcacgt 480 

actcggatgg aagccggtct tgtcgatcag gatgatctgg acgaagagca tcaggggctc 540 

gcgccagccg aactgttcgc caggctcaag gcgcgcatgc ccgacggcga ggatctcgtc 600 

gtgacccatg gcgatgcctg cttgccgaat atcatggtgg aaaatggccg cttttctgga 660 

ttcatcgact gtggccggct gggtgtggcg gaccgctatc aggacatagc gttggctacc 720 

cgtgatattg ctgaagagct tggcggcgaa tgggctgacc gcttcctcgt gctttacggt 780 

atcgccgctc ccgattcgca gcgcatcgcc ttctatcgcc ttcttgacga gttcttctga 840 

tctagatagg aggtcatcat ggcgctcacc aatgctcaaa tcttggctgt gattgacagt 900 

tgggaagaaa cagtcggtca gtttccagtg ataacgcacc atgtaccatt aggtggcggt 960 

ctgcaaggaa cgctccattg ttacgagatc cccctagcag ctccttatgg ggttggcttt 1020 

gctaagaatg ggcctacccg ctggcaatac aaacggacaa tcaatcaagt cgtccacaga 1080 

tgggggtccc acacagtccc ttttctatta gaaccggata acatcaacgg caaaacctgc 1140 

acagcatcgc acctatgtca taatactcga tgccacaatc ccttgcactt gtgctgggag 1200 

tcactagacg acaacaaagg cagaaactgg tgccccggtc ccaacggggg atgtgtccat 1260 

gcggtggttt gtttaaggca gggtccgttg tacggcccag gggcgactgt ggcaggtcct 1320 

caacaaaggg gcagtcactt tgtggtataa ctgcagaagc tttaagccag ttaactgggc 1380 

ggagctc 13 87 



